Cohere a lancé Command A+, son modèle de langage le plus puissant à ce jour et le premier que l'entreprise publie sous une licence Apache 2.0 entièrement open source. Annoncé le 20 mai 2026, le modèle repose sur une architecture Mixture-of-Experts (MoE) clairsemée avec 218 milliards de paramètres au total et 25 milliards de paramètres actifs lors de l'inférence — pouvant fonctionner sur seulement deux GPU NVIDIA H100 ou un seul NVIDIA B200.
Points clés
- Architecture MoE 218B/25B — puissance de niveau entreprise avec une utilisation efficace des paramètres actifs
- Licence Apache 2.0 — licence open source permissive autorisant l'usage commercial sans restrictions
- Support de 48 langues — contre 23 pour les modèles Command A précédents, avec des gains majeurs en tokenisation non européenne
- Fenêtre de contexte de 128K tokens — avec une génération allant jusqu'à 64K tokens
- 63% plus rapide que Command A Reasoning pour la génération de tokens
- Citations natives intégrées — chaque affirmation factuelle est automatiquement reliée à sa source
Détails techniques
Command A+ introduit ce que Cohere appelle la "quantification sans perte" — une technique permettant de compresser le modèle en précision 4 bits (W4A4) sans dégradation notable de la qualité des sorties. Cela rend possible l'exécution d'un modèle de 218 milliards de paramètres sur deux H100, abaissant considérablement le seuil d'infrastructure pour les déploiements IA auto-hébergés.
Le tokeniseur du modèle a été optimisé pour une couverture mondiale : il réduit le coût en tokens pour l'arabe de 20%, le japonais de 18% et le coréen de 16% par rapport aux versions précédentes. Cette amélioration se traduit directement par des coûts d'inférence réduits et des temps de réponse plus rapides pour les utilisateurs dans ces marchés linguistiques.
La génération de citations natives est un autre différenciateur majeur. Lorsque Command A+ récupère des informations depuis des outils ou documents externes, il génère des "spans de grounding" explicites — des liens associant chaque affirmation factuelle à la source spécifique dont elle provient. Cela est particulièrement précieux pour les secteurs réglementés comme la santé, la finance et le droit, où la traçabilité est une exigence de conformité.
Le modèle supporte des entrées multimodales (texte, images et utilisation d'outils) avec une fenêtre de contexte de 128K tokens et jusqu'à 64K tokens en sortie — idéal pour le traitement de longs documents, les workflows agentiques complexes et les pipelines RAG.
Impact stratégique
La publication sous Apache 2.0 marque un virage stratégique pour Cohere, historiquement positionnée comme fournisseur d'IA d'entreprise via API propriétaire. Cette publication la met directement en concurrence avec la série Llama de Meta et les modèles ouverts de Mistral, mais avec un focus sur l'IA souveraine qui la distingue.
Pour les gouvernements et entreprises réglementées en Afrique du Nord, au Moyen-Orient, en Europe et en Asie du Sud-Est, Command A+ offre une combinaison rare : un modèle suffisamment puissant pour des tâches agentiques complexes, assez efficient pour s'auto-héberger sans infrastructure massive, et suffisamment ouvert pour se déployer en environnements totalement isolés sans partager de données avec une API tierce.
Les 20% d'amélioration de l'efficacité de tokenisation arabe font de Command A+ l'un des modèles open source les plus rentables pour les déploiements IA en langue arabe dans la région.
Contexte
Cohere a été fondée en 2019 par d'anciens chercheurs de Google Brain. La société s'est historiquement concentrée sur les clients entreprise via des modèles API propriétaires. Command A+ est son premier modèle publié avec des poids complets sous licence open source permissive.
Cette publication fait suite à la fusion de Cohere avec Aleph Alpha, la société allemande d'IA, qui a renforcé son empreinte dans l'IA souveraine européenne. Command A+ est positionné comme modèle phare pour la clientèle combinée des deux entreprises dans le secteur public et les infrastructures critiques.
Disponibilité
Command A+ est disponible immédiatement sur Hugging Face et le Model Vault de Cohere, avec un essai gratuit via l'API Cohere. Les organisations peuvent le déployer on-premise, dans des environnements cloud privés, ou en configurations totalement isolées. Cohere a confirmé un support dès le premier jour via le framework d'inférence vLLM, facilitant l'intégration dans les infrastructures IA existantes.
Source : Blog Cohere — Introducing Command A+