Sakana AI lance Fugu : une seule API modèle qui orchestre un pool de LLM de pointe

Le laboratoire de recherche tokyoïte Sakana AI a lancé le 22 juin 2026 Sakana Fugu, un système d'orchestration multi-agents qui se comporte comme un seul modèle de fondation. Plutôt que d'entraîner un modèle géant, Fugu est lui-même un modèle de langage entraîné à coordonner un pool interchangeable d'autres LLM de pointe — décidant quand déléguer, comment les agents doivent communiquer et comment synthétiser leurs sorties — le tout derrière une unique API compatible OpenAI.

Le lancement fait suite à une bêta ouverte le 25 avril 2026, et se décline en deux variantes : Fugu pour le codage, le chat et la relecture au quotidien, et Fugu Ultra pour les travaux exigeants en plusieurs étapes comme la recherche en IA, la reproduction d'articles scientifiques, l'analyse en cybersécurité et l'examen de brevets.

Points clés

Un modèle, plusieurs modèles : Fugu gère en interne la sélection, la délégation, la vérification et la synthèse, et expose un point d'accès unique qui s'intègre aux outils compatibles OpenAI.
Des scores de niveau frontière sans modèle frontière : Fugu Ultra atteindrait 73,7 sur SWE-bench Pro, 95,5 sur GPQA-Diamond, 90,8 sur LiveCodeBench Pro et 50,0 sur Humanity's Last Exam.
Conçu pour contourner les restrictions : les équipes peuvent exclure certains agents du pool pour des raisons de conformité, et Fugu redirige automatiquement si un fournisseur devient indisponible.
Fondé par un coauteur des transformeurs : Sakana AI a été cofondée en 2023 par Llion Jones, l'un des auteurs de l'article de 2017 « Attention Is All You Need ».

Comment ça fonctionne

Fugu est un orchestrateur entraînable qui « coordonne dynamiquement plusieurs modèles de langage issus d'un pool interchangeable tout en se comportant comme un seul modèle via une seule API ». Face à une tâche difficile, il peut décomposer le problème, mobiliser des modèles spécialisés pour les sous-parties, appeler une nouvelle instance de lui-même pour gérer un sous-problème, puis vérifier et synthétiser les pièces en une réponse unique et propre — sans que cette mécanique n'apparaisse dans la requête.

L'approche s'appuie sur deux articles acceptés à l'ICLR 2026 : Trinity (« An Evolved LLM Coordinator »), qui fait évoluer un coordinateur léger attribuant les rôles de Penseur, Travailleur et Vérificateur, et Conductor (« Learning to Orchestrate Agents in Natural Language »), accompagnés d'un rapport technique dédié à Sakana Fugu.

Benchmarks

Selon la couverture du média The Decoder, Fugu Ultra devance des références solides sur plusieurs benchmarks publics : SWE-bench Pro à 73,7 contre 69,2 pour Opus 4.8 et 58,6 pour GPT-5.5 ; GPQA-Diamond à 95,5 contre 92,0 ; LiveCodeBench Pro à 90,8 contre 84,8 ; et Humanity's Last Exam à 50,0, devançant les 49,8 d'Opus 4.8. Sakana affirme que Fugu Ultra « se tient au coude à coude » avec Fable 5 et Mythos Preview — bien que ces deux modèles ne figurent pas dans le pool de Fugu car indisponibles sous contrôles à l'exportation, la comparaison reposant donc sur des résultats publiés par les fournisseurs.

Tarification

Fugu est proposé via trois formules d'abonnement — Standard à 20 dollars par mois pour un usage léger, Pro à 100 dollars par mois pour environ dix fois l'usage, et Max à 200 dollars par mois pour des charges lourdes vingt fois supérieures. Un forfait API à l'usage est également disponible, Fugu Ultra étant facturé 5 dollars par million de jetons d'entrée et 30 dollars par million de jetons de sortie.

Pourquoi c'est important pour la région MENA

L'argumentaire s'appuie directement sur un choc récent. Le 12 juin 2026, les contrôles américains à l'exportation ont retiré les modèles Fable 5 et Mythos d'Anthropic de la disponibilité mondiale, pratiquement du jour au lendemain — une décision qui a touché les développeurs en Tunisie, en Arabie saoudite et dans toute la région. Sakana résume la leçon sans détour : « Pour une organisation ou une nation, dépendre des API d'une seule entreprise pour des infrastructures critiques, la finance ou la gouvernance constitue une vulnérabilité matérielle. »

Une couche d'orchestration interchangeable offre de la résilience : si un fournisseur est restreint, le pool redirige et l'application continue de fonctionner. Pour les organisations soumises à des règles de résidence des données comme le cadre de l'INPDP en Tunisie et la dynamique plus large de conformité aux lois de protection des données dans la région, la capacité à choisir les modèles qui composent le pool — et à exclure ceux qui ne répondent pas aux exigences locales — constitue un levier concret, même si une véritable souveraineté ne se vérifierait pleinement qu'en cas de restriction simultanée de plusieurs fournisseurs.

Et ensuite

Fugu érige l'orchestration elle-même en produit, un virage notable par rapport à la course à des modèles uniques toujours plus grands. Si l'approche tient sous des charges réelles, on peut s'attendre à ce que les concurrents proposent leurs propres points d'accès de type routeur — et à ce que les acheteurs en entreprise pondèrent résilience et conformité au regard des seuls scores bruts.

Source : Sakana AI