NVIDIA a récemment lancé l’accélération AI de TensorRT pour ses GPU GeForce RTX, permettant d’atteindre des performances deux fois supérieures par rapport à DirectML.
Boost de Performance AI de 2x avec TensorRT sur Tous les GPU RTX
La firme annonce que TensorRT sera désormais accessible aux utilisateurs de GPU RTX. Grâce à cette technologie, les utilisateurs pourront profiter d’une performance améliorée grâce à un fonctionnement optimisé pour l’inférence.

Avec cette mise à jour, les utilisateurs observeront des gains de performance allant jusqu’à 2x pour les applications AI en comparaison avec DirectML. De plus, TensorRT est pris en charge de manière native par Windows ML, facilitant son utilisation pour les développeurs.

Le développement d’applications pour l’AI nécessite souvent de choisir entre des frameworks offrant un large support hardware, mais peu de performances, ou des solutions optimisées pour des matériels spécifiques. Windows ML a été conçu pour surmonter ces défis.
Ce framework s’appuie sur ONNX Runtime et s’intègre parfaitement à une couche d’exécution AI optimisée. Pour les GPU GeForce RTX, Windows ML utilise automatiquement TensorRT, garantissant ainsi des performances impressionnantes pour le déploiement AI.
Windows ML simplifie le travail des développeurs en sélectionnant automatiquement le meilleur hardware pour exécuter chaque fonctionnalité AI, facilitant ainsi l’intégration des dernières optimisations.

La performance n’est pas le seul point fort de TensorRT pour la RTX. Ce nouveau backend réduit également la taille des fichiers de bibliothèque, jusqu’à 8x plus petite, tout en incluant des optimisations Just-in-time par GPU. La disponibilité est prévue pour juin sur tous les GPU GeForce RTX.
NVIDIA présente également des améliorations notables en termes de performances AI avec TensorRT. Par exemple, dans ComfyUI, les utilisateurs peuvent bénéficier d’un gain de 2x, tandis que les applications comme DaVinci Resolve et Vegas Pro offrent un surplus de 60%. Cela permet d’accélérer les flux de travail AI tout en exploitant pleinement le potentiel des GPU RTX.
Les innovations logicielles de NVIDIA continuent avec plus de 150 SDK AI et 5 nouvelles intégrations ISV prévues ce mois-ci. Parmi celles-ci :
- LM Studio (+30% de performances avec CUDA récent)
- Topaz Video AI (GenAI Video avec CUDA)
- Bilibili (Effets NVIDIA Broadcast)
- AutoDesk VRED (DLSS 4)
- Chaos Enscape (DLSS 4)
Par ailleurs, NVIDIA présente des NIMs et des AI Blueprints, y compris de nouveaux plugins pour Project G-Assist, intégrant Discord, Gemini, IFTTT, Twitch, Spotify et SignalRGB. Les utilisateurs peuvent également concevoir leurs propres plugins en se rendant sur github.com/NVIDIA/G-Assist.



