NVIDIA introduit un nouveau service logiciel permettant aux clients de centres de données de suivre en temps réel l’emplacement de leur flotte de GPU d’IA, sans aucune fonctionnalité de désactivation.
NVIDIA : Suivi en temps réel de la flotte de GPU d’IA
Récemment, des rapports ont révélé que les GPU d’IA très recherchés de NVIDIA étaient détournés vers des zones interdites par les prohibitions d’exportation américaines. Ces puces finissent en Chine, où le gouvernement américain a récemment approuvé la vente des GPU Hopper H200. Malgré cela, des GPU récents basés sur l’architecture Blackwell continuent d’être acquis par des agences chinoises.
Pour contrer cette activité illégale, NVIDIA a développé un service logiciel capable d’indiquer le pays d’utilisation de ses puces. Bien que cette technologie ait été démontrée en privé, la situation actuelle du marché a incité NVIDIA à la déployer initialement pour ses clients.

Les clients peuvent opter pour ce logiciel, leur permettant de suivre l’ensemble de leur flotte de GPU d’IA. Ce nouvel agent logiciel utilise la télémétrie des GPU pour surveiller des statistiques comme la santé, l’intégrité et l’inventaire, garantissant ainsi aux utilisateurs de savoir où et dans quel état se trouvent leurs GPU.
Le blog NVIDIA détaille les fonctionnalités de ce service :
- Suivi des pics de consommation d’énergie pour respecter les budgets énergétiques tout en maximisant la performance.
- Surveillance de l’utilisation, de la bande passante mémoire et de la santé des interconnexions.
- Détection précoce des points chauds et des problèmes de circulation d’air pour éviter le throttling thermique.
- Confirmation des configurations logicielles afin d’assurer des résultats fiables.
- Identification des erreurs pour déceler des composants défaillants.
« Nous sommes en train de mettre en œuvre un nouveau service logiciel qui permet aux opérateurs de centres de données de surveiller la santé et l’inventaire de leur flotte de GPU d’IA, » a déclaré un représentant de NVIDIA. « Cet agent logiciel installé par le client utilise la télémétrie des GPU. »
Représentant de NVIDIA pour OMGPU
Les données seront hébergées sur le portail NGC de NVIDIA, où les clients inscrits pourront consulter différentes métriques de suivi de leurs GPU.
Ce service sera d’abord déployé sur les GPU Blackwell, qui sont très demandés, alors que les ventes en Chine et dans les régions contrôlées par des exportations restent soumises à autorisation.
« Aucune fonctionnalité permettant à NVIDIA ou à un acteur distant de désactiver les GPU n’est incluse, » a précisé NVIDIA. « Il n’y a pas de kill switch. »
via Reuters
NVIDIA réaffirme qu’aucun kill switch n’est intégré dans le logiciel, ce qui permettra aux utilisateurs de détecter et de désactiver manuellement un GPU si nécessaire.



