Qualcomm rachète Modular pour 3,9 milliards de dollars et défie le monopole CUDA de NVIDIA

Qualcomm a annoncé le rachat de Modular, la startup spécialisée dans les logiciels d'IA à l'origine du langage de programmation Mojo et du moteur d'inférence MAX, dans le cadre d'une transaction entièrement en actions évaluée à environ 3,9 milliards de dollars. Annoncée le 24 juin 2026, cette acquisition représente le défi le plus direct jamais lancé par Qualcomm contre la mainmise de NVIDIA sur le développement de l'IA via son écosystème logiciel CUDA, qui remonte à dix-sept ans.

La transaction est structurée sous forme d'émission de 19,2 millions d'actions Qualcomm destinées aux actionnaires de Modular — plus que doublant la valorisation de Modular de 1,6 milliard de dollars établie en septembre 2025 — et intègre environ 150 employés dans l'organisation d'ingénierie de Qualcomm. Les co-fondateurs de Modular, Chris Lattner et Tim Davis, devraient rester au sein de l'entreprise fusionnée.

Points clés

Qualcomm acquiert Modular dans une transaction entièrement en actions de 3,9 milliards de dollars annoncée le 24 juin 2026
Le langage Mojo permet d'écrire le code une seule fois et de le déployer sur des puces NVIDIA, AMD, Intel, Qualcomm et Apple Silicon
Le moteur MAX offre des gains de débit de 20 à 50 % par rapport aux solutions concurrentes comme vLLM et SGLang
L'opération cible le fossé logiciel CUDA de NVIDIA vieux de 17 ans grâce à la portabilité entre architectures
Qualcomm poursuit parallèlement une acquisition de Tenstorrent estimée entre 8 et 10 milliards de dollars
Qualcomm vise 15 milliards de dollars de revenus issus des centres de données d'ici l'exercice fiscal 2029

Ce que Modular apporte

La stack technologique de Modular repose sur deux composantes complémentaires. Le langage Mojo est un langage système à syntaxe compatible Python qui compile avec des performances proches du C/CUDA — le même code source peut cibler des GPU NVIDIA, des accélérateurs AMD, des processeurs Intel et des puces Qualcomm sans réécriture spécifique à chaque matériel. Mojo a été conçu par Chris Lattner, qui a précédemment architecturé LLVM et créé le langage Swift d'Apple.

Le moteur d'inférence MAX se situe au-dessus de Mojo pour gérer l'exécution des modèles d'IA sur différentes plateformes matérielles. Il expose des endpoints HTTP compatibles OpenAI, prend en charge des modèles open-weight pré-optimisés et revendique des gains de débit de 20 à 50 % par rapport aux solutions concurrentes, dont vLLM et SGLang. Une troisième composante, la couche d'orchestration Mammoth, étend la stack d'un service à nœud unique vers une inférence distribuée à grande échelle.

Ces outils s'attaquent ensemble à la dépendance fondamentale qui a assuré la domination de NVIDIA : le code optimisé pour CUDA ne se transfère pas facilement vers d'autres fournisseurs de matériel. Modular réduit ce coût de transition en abstrayant le matériel derrière une couche unifiée de développement et de déploiement.

Le défi CUDA

L'avantage concurrentiel de NVIDIA repose sur dix-sept ans de capitalisation logicielle. Des millions de lignes de code CUDA, des milliers de bibliothèques optimisées et toute une génération d'ingénieurs formés à cet écosystème constituent un fossé qui ne se comblera pas rapidement. Mais le centre de gravité de l'industrie se déplace des charges de travail d'entraînement — où l'avantage du premier arrivé de CUDA est le plus prononcé — vers l'inférence, où la portabilité prend une importance stratégique croissante.

Cristiano Amon, PDG de Qualcomm, a présenté l'opération comme "un moment charnière" dans la transition de l'industrie vers "des architectures disaggregées et multi-fournisseurs qui exigent une base logicielle plus ouverte et moderne." Cette acquisition positionne Qualcomm pour détenir l'une des rares couches logicielles capables de faire d'une puce d'IA non-NVIDIA un choix de déploiement à faible risque pour les équipes enterprise.

Une résistance sectorielle plus large

Qualcomm n'agit pas seul dans cette direction. OpenAI a développé la puce d'inférence personnalisée Jalapeño pour réduire sa dépendance au matériel NVIDIA à grande échelle. Les puces Apple de la série M — associées à leur stack de calcul Metal — ont rendu l'inférence d'IA sur appareil économiquement viable sans recourir à CUDA. Le projet ROCm d'AMD poursuit la portabilité du calcul GPU depuis des années, bien que son adoption reste plus lente que les alternatives CUDA.

Qualcomm poursuit parallèlement une acquisition de la startup de puces d'IA Tenstorrent pour un montant estimé entre 8 et 10 milliards de dollars, signalant une ambition plus large de se positionner sur la conception de silicon et les outils logiciels dans le marché des centres de données.

Implications pour les centres de données MENA

Pour les équipes d'infrastructure IA en Arabie Saoudite, aux Émirats Arabes Unis et dans l'ensemble de la région MENA, la transaction Qualcomm-Modular présente des implications opérationnelles directes. Les contrôles à l'exportation ont rendu l'approvisionnement en GPU haut de gamme NVIDIA plus complexe dans certains marchés. Alors que l'inférence de modèles frontier devient la charge de travail principale des centres de données régionaux — de HUMAIN en Arabie Saoudite aux initiatives souveraines d'IA dans le Golfe — la capacité à déployer une inférence optimisée sur du matériel non-NVIDIA sans réécriture du code de production représente un avantage stratégique significatif.

Une stack logicielle agnostique au matériel ne supprime pas le besoin de silicon performant, mais réduit substantiellement le coût de changement de fournisseurs à mesure que les contraintes géopolitiques et les chaînes d'approvisionnement évoluent.

Et après ?

La transaction devrait être finalisée au second semestre 2026, sous réserve des approbations réglementaires. La feuille de route présentée lors de la Journée des Investisseurs de Qualcomm a confirmé la famille de puces Dragonfly pour centres de données comme partenaire matériel de la stack logicielle de Modular. Chris Lattner et Tim Davis devraient diriger la division logicielle au sein de Qualcomm après la clôture, tandis que la communauté de développeurs existante de Modular et sa bibliothèque de modèles open-weight continueront de s'enrichir.

Source : Eastern Herald