Groq lève 650 M$ pour bâtir un neocloud d'inférence après l'accord à 20 Md$ de Nvidia

La startup de puces d'intelligence artificielle Groq lève 650 millions de dollars auprès de ses investisseurs existants pour financer un second acte en tant que fournisseur cloud spécialisé dans l'inférence, environ six mois après que Nvidia a versé près de 20 milliards de dollars dans un accord de licence qui lui a retiré le fondateur de l'entreprise et une grande partie de son équipe d'ingénierie centrale. Le tour de table a d'abord été révélé par Axios fin mai 2026 et est piloté en interne par le PDG par intérim Adam Winter et le directeur financier Matt Eng.

Points clés

Groq lève 650 millions de dollars auprès de ses bailleurs actuels, les investisseurs Disruptive et Infinitum se tenant prêts à couvrir toute portion du tour que les autres actionnaires ne souscriraient pas au prorata.
Ces fonds font suite à l'opération de Nvidia de décembre 2025, estimée à environ 20 milliards de dollars : une licence non exclusive sur la technologie de puces de Groq qui a aussi fait passer le fondateur Jonathan Ross et des ingénieurs seniors chez Nvidia.
L'argent frais financera la capacité de GroqCloud et le développement de la prochaine génération de Language Processing Unit (LPU), repositionnant Groq en neocloud d'inférence pour l'IA.

Détails

L'arrangement qui a remodelé Groq était inhabituel, même au regard des standards de 2026. Plutôt que d'acquérir purement et simplement l'entreprise, Nvidia a structuré un accord de licence dont la valeur aurait avoisiné 20 milliards de dollars : elle a obtenu des droits sur l'architecture de puces de Groq, a versé en numéraire les investisseurs existants de la startup et a recruté plusieurs employés seniors de Groq, dont le fondateur et directeur général Jonathan Ross. Élément crucial, Groq elle-même est restée une entreprise indépendante.

Ce qui subsiste est précisément l'activité sur laquelle Groq mise désormais. La startup s'est recentrée sur son cloud d'inférence, qui permet aux développeurs et aux entreprises d'héberger des applications gourmandes en inférence sur le matériel LPU propriétaire de Groq, une architecture conçue spécifiquement pour le traitement postérieur à la requête qui alimente les agents conversationnels en direct, les agents autonomes et les fonctionnalités d'IA en temps réel. Groq affirme avoir déjà livré ses puces à plusieurs fournisseurs de modèles et clients cloud.

La direction a évolué en même temps que la stratégie. Avec le départ de Ross chez Nvidia, Adam Winter occupe le poste de directeur général par intérim et Matt Eng celui de directeur financier, les deux dirigeants orientant la levée de 650 millions de dollars vers l'expansion de la capacité de GroqCloud et le développement de la prochaine génération de puces LPU.

Impact

Ce virage reflète l'un des changements les plus nets du marché du matériel d'IA : l'inférence, le travail effectué chaque fois qu'une requête d'IA reçoit une réponse, a dépassé l'entraînement des modèles comme source de demande la plus importante et la plus durable. À mesure que les entreprises passent de l'expérimentation de l'IA à son exploitation en production, le coût et la latence du service des modèles à grande échelle comptent davantage que la dépense ponctuelle de leur entraînement.

Pour les développeurs, un Groq bien capitalisé en concurrence sur la vitesse et le prix de l'inférence pourrait offrir davantage de choix au-delà des clouds GPU dominants. Groq a longtemps présenté sa LPU comme offrant une inférence à faible latence et à haut débit, et un neocloud dédié bâti autour de ce matériel le placerait en concurrence directe avec les offres d'inférence de fournisseurs plus grands.

Contexte

Groq a été fondée par Jonathan Ross, un ancien ingénieur de Google qui a contribué à créer le Tensor Processing Unit de l'entreprise, et elle a passé des années à positionner la LPU comme une alternative spécialisée aux GPU généralistes pour les charges de travail liées au langage. L'accord de décembre 2025 avec Nvidia, en absorbant le fondateur et les talents clés tout en concédant une licence sur la technologie centrale, a brouillé la frontière entre acquisition et partenariat et a laissé l'entreprise restante tracer une nouvelle voie avec un produit familier.

La suite

Si le tour de table se conclut comme décrit, Groq entrera dans la seconde moitié de 2026 avec des fonds frais, un recentrage sur l'inférence et le filet de sécurité d'investisseurs prêts à financer eux-mêmes l'intégralité de la levée. La question ouverte est de savoir si une stratégie de neocloud peut faire vivre une entreprise dont l'équipe fondatrice d'origine siège désormais au sein de son plus grand partenaire industriel, et si la demande d'une inférence rapide et bon marché suffit à se tailler une place durable dans un marché de plus en plus saturé.

Source : TechCrunch