Au-delà de MemPalace : comment les systèmes multi-agents fonctionnent réellement

Le cycle de hype MemPalace

Début avril 2026, MemPalace a explosé sur GitHub. 23 000 étoiles. 3 000 forks. Le nom de Milla Jovovich sur le README. La promesse : "le système de mémoire IA le mieux noté jamais benchmarké" avec 96,6 % de rappel sur LongMemEval et un score parfait de 100 % en mode hybride.

En 48 heures, la communauté développeur a commencé à tirer le fil.

Les reviewers indépendants chez Penfield Labs et Nicholas Rhodes ont découvert que le score de 96,6 % mesure la performance du modèle d'embedding par défaut de ChromaDB, pas l'architecture palace elle-même. Les ailes, salles et halls qui donnent son nom à MemPalace dégradent la précision de récupération quand ils sont activés. Le score hybride de 100 % a été obtenu en identifiant les questions échouées, en créant des correctifs pour ces questions précises, puis en retestant sur le même jeu de données.

Le système de compression AAAK, présenté comme une "compression sans perte 30x", fait chuter la précision LongMemEval de 96,6 % à 84,2 % dans les tests indépendants. Et un token crypto est apparu sur pump.fun dans les 24 heures suivant le lancement, avec un partage de récompense de 50 % entre Jovovich et le co-créateur Ben Sigman, PDG de la plateforme de prêt crypto Bitcoin Libre.

Le marketing par célébrités, ce n'est pas de l'ingénierie. Le théâtre de benchmarks, ce n'est pas du logiciel de production.

Ce que Karpathy a réellement décrit

Pendant que MemPalace chassait les scores, Andrej Karpathy esquissait une vision fondamentalement différente pour les systèmes de connaissances LLM. Son concept comporte trois couches :

Couche 1 (Sources brutes) : Données immuables — conversations, documents, logs
Couche 2 (Le Wiki) : Connaissances générées par LLM qui se composent dans le temps, maintenues et mises à jour par le système lui-même
Couche 3 (Schéma) : Configuration qui façonne l'organisation et la récupération des connaissances

L'insight critique est que la connaissance doit se composer. Chaque requête doit rendre le système plus intelligent. Chaque interaction doit construire sur ce qui précède.

MemPalace stocke les données de conversation verbatim et repose sur la recherche vectorielle. C'est la Couche 1 avec un index de recherche. Pas de composition. Pas de wiki maintenu. Pas de connaissance qui grandit.

AgentX : la connaissance multi-agents en production

AgentX n'a pas été construit pour gagner des benchmarks. Il a été construit en 48 heures parce qu'Anthropic a mis à jour ses conditions d'utilisation début 2026, tuant OpenClaw et mettant 24 agents de production hors service du jour au lendemain.

Le résultat est une plateforme d'orchestration multi-agents (npm : agentix-cli, licence MIT) qui implémente la vision de Karpathy à travers la spécialisation des agents et la coordination persistante :

Les mentions bot-à-bot comme routage de connaissances

Quand un agent PM mentionne @noqta_devops_bot sur Telegram, ce n'est pas du simple passage de messages. C'est du routage de connaissances — le contexte du PM (exigences utilisateur, contraintes de délai, décisions architecturales) circule vers DevOps avec l'historique complet de la conversation. DevOps répond avec la réalité infrastructure. Cet échange devient un contexte persistant que les deux agents référencent dans les interactions futures.

Découverte mesh et spécialisation

AgentX gère un mesh d'agents spécialisés — PM, DevOps, QA, Coder — à travers plusieurs nœuds :

Découverte d'agents : Enregistrement automatique avec mise à jour en temps réel du registre
Communication inter-nœuds : Des agents sur un MacBook local coordonnent avec des agents sur des serveurs distants
Routage multi-canal : Le même agent opère sur Telegram, WhatsApp, GitLab et Discord simultanément
Délégation par rôle : Les tâches circulent vers le bon spécialiste automatiquement

Des vrais chiffres, pas du théâtre

AgentX fait tourner plus de 24 agents en production sur plusieurs projets clients :

Génération de contenu quotidienne automatisée en 3 langues
Revue de code inter-agents où les agents QA vérifient indépendamment ce que les agents Coder produisent
Orchestration multi-agents via Telegram avec délégation, coordination et livraison
Gestion de projets clients via mentions bot-à-bot

La différence qui compte

MemPalace est un système de mémoire pour une seule session IA. Le vrai problème est la coordination des connaissances multi-agents : comment 24 agents avec des spécialités différentes construisent-ils une compréhension partagée qui se compose dans le temps ?

AgentX ne stocke pas les souvenirs dans un palais. Il route les connaissances à travers un mesh vivant d'agents spécialisés où chaque interaction rend le système plus capable.

Commencer

npm install -g agentix-cli
agentx init
agentx agent:create --name "my-agent" --role coder
agentx start

Si vous avez besoin d'un système multi-agents de production — pas une démo benchmarkée, mais des agents qui codent, gèrent des projets et coordonnent entre les canaux — explorez nos services d'agents IA ou consultez nos plans.

Pour les équipes utilisant déjà AgentX, notre tutoriel de configuration multi-agents couvre l'intégration Telegram complète, et notre analyse approfondie du pattern de Karpathy explique les fondements théoriques.