Pékin multiplie les pistes pour s’affranchir de CUDA, la brique logicielle clé de NVIDIA. Un haut cadre de l’industrie des semi-conducteurs recommande une voie différente: des puces définies par logiciel pour réduire la dépendance à un écosystème unique. Une stratégie qui déplacerait l’intelligence du calcul vers le logiciel et remettrait en question le rôle du GPU classique.
Pourquoi la Chine veut miser sur des puces définies par logiciel
La Chine cherche depuis des années à s’émanciper de CUDA de NVIDIA, et une voie de contournement récemment mise en avant mérite d’être soulignée.
Une responsable des semi-conducteurs en Chine conseille à l’industrie IA locale de passer aux puces définies par logiciel
Lorsqu’on interroge Jensen Huang sur la domination de NVIDIA en IA, il cite systématiquement CUDA comme le meilleur rempart, fruit d’un effort constant pour bâtir un écosystème logiciel robuste qui démarque Team Green. De son côté, Pékin s’inquiète de la dépendance de son industrie à CUDA. Wei Shaojun, cadre de la China Semiconductor Industry Association, appelle donc à concevoir des alternatives à CUDA et aux autres composants venant de l’Ouest.
Même si ce propre technologie n’est pas assez bonne au départ, elle doit quand même être utilisée. L’essai-erreur peut échouer, mais sans essayer, nous prendrons assurément du retard.
– Wei Shaojun
Plutôt que de chercher un équivalent strict de CUDA, Wei Shaojun défend une stratégie rarement mise sur la table: la “puce définie par logiciel” (SDC). L’idée est de déplacer l’intelligence du calcul vers le logiciel, au lieu de s’appuyer sur une configuration hardware figée. Aujourd’hui, la maturité de l’écosystème incite les développeurs à rester sur CUDA, ce qui les lie indirectement au hardware NVIDIA. L’approche SDC inverse la logique, et voici comment.

Avec une SDC, pas besoin d’une couche type CUDA pour exécuter les calculs: la puce s’appuie sur une grille reconfigurable commandée par un bitstream généré par le compilateur. En clair, ni le compilateur ni la représentation du code au niveau source ne dépendent d’une ISA; la chaîne gagne en souplesse. Contrairement aux GPU, qui reposent sur un ordonnanceur dédié, les SDC misent sur une compilation déterministe où chaque mouvement de données, jusqu’au cycle d’horloge, est suivi.
Selon le professeur Wei Shaojun, bâtir des couches de traduction et des écosystèmes indépendants pour reproduire le succès de CUDA coûterait trop cher, d’où l’intérêt du pari SDC pour la Chine. Mais cette voie rend le compilateur central et redoutablement complexe: routage, branchements et modifications structurelles bousculent les habitudes de l’ingénierie hardware. Des exemples existent déjà, comme les RDU de SambaNova et les LPU de Groq, conçues pour des charges spécifiques plutôt que pour remplacer totalement les GPU.



