La V100 de NVIDIA, un GPU de 8 ans, se vend 100 € et surpasse les cartes grand public modernes en AI LLM

Par Quentin Mis à jour le 12 Mai 2026 à 12 h 26

Les GPU récents excellent dans les charges IA, pourtant une NVIDIA V100 âgée de 8 ans, disponible autour de 100€, dépasse des cartes plus modernes sur les grands modèles de langage. Hardware Haven a mis cette pièce de collection à l’épreuve face à une RTX 3060 de 5 ans et une RX 7800 XT de 3 ans. Les performances et l’efficacité énergétique de ce vétéran impressionnent.

NVIDIA V100, un GPU de 8 ans, surpasse la RTX 3060 de 5 ans et la RX 7800 XT de 3 ans en performances et efficacité sur les LLM

La génération Volta de NVIDIA marque les débuts d’une gamme dédiée aux centres de données, absente du marché grand public pour les jeux. Elle introduit les Tensor Cores, piliers des progrès en IA chez le fondeur. Hardware Haven a testé une V100 de 8 ans sur des LLM actuels.

Voici un rappel des specs de la NVIDIA Tesla V100. Elle existe en versions SXM et PCIe. Les modèles SXM s’intègrent dans les data centers via un connecteur mezzanine pour alimentation directe et NVLink.

La V100 testée est un modèle SXM2 avec 5120 cœurs, 320 TMU, 128 ROP et 640 Tensor Cores. Son cache L2 fait 6 Mo, sa fréquence grimpe à 1530 MHz, avec 16 ou 32 Go de HBM2 sur bus 4096 bits pour 898 Go/s de bande passante. Son TDP de 250W paraît modeste face aux Blackwell à plus de 1 kW.

Lors de sa sortie, la NVIDIA Tesla V100 valait plus de 10 000€, mais aujourd’hui, la version 16 Go se trouve sur eBay pour 100€ seulement.

Le vrai défi réside dans la compatibilité avec un PC standard. Aucun Boîtier ne gère le SXM2 nativement. Il faut un adaptateur SXM vers PCIe, avec ses 2 connecteurs 8-pins et trois headers ventilos 4-pins.

Autre obstacle : le refroidissement. Conçue pour les data centers massifs, la série Tesla fonctionne en passif avec un gros dissipateur. Ce dernier et la backplate sont solides, mais inadaptés à un usage continu en PC domestique. Le testeur a fabriqué un duct imprimé en 3D et un ventilo Noctua pour un flux direct.

Le prix total du GPU et accessoires dépasse légèrement 200€, bien en dessous de la RTX 3060 12 Go ou RX 7800 XT 16 Go utilisées en comparaison.

Premier LLM testé : GPT-oss à 20 milliards de paramètres. La config V100 atteint 130 tokens/s, contre 90 pour la RX 7800 XT.

Face à la NVIDIA GeForce RTX 3060 12 Go de 5 ans, la V100 gagne 42% sur Gemma4:e4b (ollama+openwebui) en vitesse de génération de tokens. Son efficacité énergétique prime aussi : malgré une conso supérieure, elle devance de 12% l’Ampere plus jeune.

Limitée à 100W, elle conserve son avance de 41% en efficacité tokens/s/watt sur la RTX 3060.

A bar chart titled 'gemma4:e4b' shows the RTX 3060 12GB (PL 100) performing with 68 tokens/sec at 171W, while the V100 16GB (PL 100) achieves 95 tokens/sec at 170W.

A bar chart titled 'gemma4:e4b' compares the performance of V100 16GB and RTX 3060 12GB under a 100W power limit, showing V100 16GB scoring 0.55 and RTX 3060 12GB scoring 0.39 for token/sec/watt.

Ces anciens GPU restent pertinents pour les LLM, avec un excellent rapport qualité-prix et une efficacité remarquable, mais exigent des modifications maison pas à la portée de tous. La version 32 Go coûte 400 à 500€, utile pour des modèles plus volumineux. Le média prévoit d’autres tests : consultez leur chaîne et la vidéo complète ci-dessous.

NVIDIA