Transformez votre emplacement M.2 libre en accélérateur LLM 20B avec ce module IA: 32 Go, 60 TOPS

Par Quentin Le 15 Avr 2026 à 09 h 37

Unigen lance Amaretti E1.S, un module d’IA au format M.2/E1.S qui se glisse dans l’emplacement d’un SSD tout en accélérant l’inférence locale. Avec un NPU à 60 TOPS, jusqu’à 32 Go de mémoire et une enveloppe de 10 W, il cible PC fixes, portables et mini‑machines disposant d’un slot libre. De quoi exécuter des modèles allant jusqu’à 20 milliards de paramètres sans mobiliser une carte dédiée pleine hauteur.

Un module M.2/E1.S taillé pour l’IA locale : architecture et performances

Le dernier module IA d’Unigen se branche sur un slot M.2 standard, offre jusqu’à 60 TOPS, embarque jusqu’à 32 Go de mémoire et peut faire tourner des LLM de 20 milliards de paramètres.

Unigen Amaretti : module IA avec NPU 60 TOPS, 32 Go de mémoire et seulement 10 W sur port M.2 ou E1.S

Avec la montée des agents IA locaux, plusieurs acteurs présentent des formats inédits. Unigen dévoile Amaretti E1.S, un module minuscule compatible M.2 qui reprend le gabarit d’un SSD tout en apportant des capacités d’inférence solides.

L’Amaretti E1.S s’appuie sur l’accélérateur SAKURA‑II d’EdgeCortix, pensé pour les plateformes basse consommation comme Raspberry Pi 5 et autres solutions ARM. La puce intègre un NPU à 60 TOPS en INT8 et 30 TFLOPS en BF16, un double contrôleur mémoire LPDDR4x 64 bits et 20 Mo de SRAM embarquée. Le boîtier BGA 19×19 consomme environ 8 à 10 W.

Unigen a intégré SAKURA‑II sur un support E1.S avec jusqu’à 32 Go de mémoire. Le module existe en versions 16 Go et 32 Go, avec une bande passante annoncée jusqu’à 68 Go/s. Donnée pour 10 W, la carte atteint environ 6 TOPS par watt.

Côté usages, les 32 Go permettent de faire tourner sans peine des LLM jusqu’à 20 milliards de paramètres, pratique pour des solutions à faible consommation gérant des flux GenAI et d’IA agentique. On peut aussi empiler plusieurs modules sur différents ports M.2 pour additionner les ressources. EdgeCortix propose déjà une variante PCIe plus musclée avec deux puces et des fonctions avancées, mais l’option M.2 reste particulièrement intéressante pour les intégrations compactes.

De nombreux PC fixes et portables disposent de ports M.2 inoccupés. Pour accélérer des charges d’IA locales sans modifier lourdement la machine, ces modules sont pertinents.

D’après Unigen, le module est compatible avec les frameworks TensorFlow, PyTorch, ONNX et Hugging Face. Principales caractéristiques :

Module IA E1.S
Accélérateur IA : SAKURA‑II
Jusqu’à 1920 TOPS en inférence avec des serveurs bi‑CPU refroidis par air
Environ 20% de la consommation des TPUs par rapport aux GPU d’entraînement
LLM génératifs jusqu’à 20 milliards de paramètres
Délais de livraison d’environ 14 semaines, nettement inférieurs à ceux des serveurs GPU
Jusqu’à 32 Go par module

Unigen livre l’Amaretti E1.S avec un dissipateur pré‑installé. Aucune information officielle sur le prix pour le moment, mais la capacité mémoire laisse présager un positionnement en conséquence.