Intel et SambaNova répondent au partenariat NVIDIA–Groq, les GPU seuls ne peuvent pas dominer l’inférence

Par Quentin Le 8 Avr 2026 à 17 h 39

L’inférence devient le nouveau champ de bataille pour les fournisseurs de calcul. Après l’accord NVIDIA-Groq, l’industrie a compris qu’il faut bien plus que de simples GPU pour tenir la charge des modèles modernes. Un autre duo s’affirme désormais: Intel et SambaNova. Leur proposition mise sur une architecture hétérogène qui répartit finement les rôles entre unités de calcul spécialisées et CPU.

Intel et SambaNova misent sur une inférence hétérogène

L’inférence est la priorité du moment pour les acteurs du calcul, et après le partenariat NVIDIA-Groq, le secteur a réalisé qu’il lui faut bien plus que des GPU. De là émerge une nouvelle paire: Intel et SambaNova.

Les CPU Xeon 6 d’Intel serviront d’hôte pour des systèmes agents, avec le SN50 de SambaNova dédié au decode

Au GTC de cette année, NVIDIA a présenté l’inférence désagrégée et expliqué l’intérêt de passer d’une vision “tout GPU” à une combinaison de blocs de calcul plus variés. Après la licence passée avec Groq, ses LPUs basés sur la SRAM sont arrivés dans les racks LPX de Rubin. Dans le même esprit, Intel et SambaNova dévoilent une “architecture d’inférence” qui associe les RDU de SambaNova aux CPU Xeon 6 d’Intel.

SambaNova annonce aujourd’hui la nouvelle étape de sa collaboration avec Intel: une solution matérielle hétérogène qui combine des GPU pour le prefill, des processeurs Intel® Xeon® 6 à la fois comme hôte et comme CPU “d’action”, et des RDU SambaNova pour le decode, afin d’offrir une inférence de premier plan pour les applications d’IA agentiques les plus exigeantes.

– SambaNova

Dans cette configuration, les RDU sont affectées au decode, tandis que les GPU assurent le prefill et que les Xeon 6 prennent en charge l’orchestration et les tâches générales. Le duo Intel-SambaNova ne verrouille pas le choix du fournisseur de GPU chez un hyperscaler, et l’on peut aussi imaginer des ASIC intégrés dans ce schéma, même si SambaNova n’a pas détaillé des chiffres spécifiques côté GPU. Le constructeur intégrera ses unités SN50, dont on reparle plus bas, et affirme avoir retenu les Xeon 6 comme plate-forme idéale pour des “workflows d’agents de bout en bout”, préférés ici à des options ARM.

Passons au SN50. Présentée au début de 2026, la plateforme embarque des RDU de cinquième génération et combine DRAM, SRAM et HBM. On y trouve 2 To de DDR5, 64 Go de HBM3 et 520 Mo de SRAM. L’objectif de ce montage mémoire est clair: réduire la latence, maintenir un débit élevé et offrir une grande capacité. Rares sont les accélérateurs à adopter une telle topologie; d’après SambaNova, l’alliage DRAM + SRAM + HBM crée un “agentic caching”.

Plus globalement, l’approche Intel-SambaNova mise sur un pari plus prudent que celle de NVIDIA, car elle ne réclame pas une infrastructure lourde pour l’inférence désagrégée. Pour les hyperscalers qui veulent une offre modulaire à l’échelle du rack basée sur le duo “prefill + decode”, le choix Intel-SambaNova a du sens. On s’attendait à voir Intel aller plus loin dans l’intégration RDU, mais pour l’instant, le rôle semble cantonné au CPU Xeon comme hôte.

Le CEO d’Intel a participé au dernier tour de table de SambaNova, et Lip-Bu est aussi un investisseur de la première heure. Des discussions d’acquisition ont existé, mais auraient été stoppées après un désaccord au conseil, d’où la position actuelle d’Intel comme investisseur.

Intel NVIDIA