Hermes Agent : l'IA open source qui apprend de chaque tâche

Le 10 mai 2026, un événement discret a redessiné le paysage des agents IA. Hermes Agent de Nous Research a dépassé OpenClaw pour s'emparer de la première place du classement mondial des tokens quotidiens sur OpenRouter — traitant 224 milliards de tokens en une seule journée. Trois mois seulement après son lancement en février 2026, Hermes avait accumulé plus de 140 000 étoiles sur GitHub et près de 1 000 contributeurs.

Quelque chose distingue cet agent. Cette différence, c'est l'auto-évolution.

Qu'est-ce que Hermes Agent ?

Hermes Agent est un agent IA open source et auto-améliorant, développé par Nous Research et publié sous licence MIT. Ce n'est pas un simple wrapper de chatbot ni un template de prompt. C'est une couche d'orchestration active — un framework qui gère la mémoire persistante, l'utilisation des outils et la création de compétences dans une boucle continue entre les sessions.

La philosophie fondamentale : chaque tâche est une opportunité d'apprentissage. Lorsque Hermes résout un problème, il ne se contente pas de fournir une réponse. Il écrit un fichier de compétence capturant les étapes précises, les cas limites et les connaissances acquises. À la prochaine tâche similaire, il récupère cette compétence et l'utilise comme contexte de travail.

Le résultat : un agent dont la valeur se cumule avec le temps. Plus vous l'utilisez, plus il excelle dans ce que vous faites réellement.

L'architecture d'apprentissage automatique

Hermes suit une boucle en trois phases :

Faire — Exécuter la tâche en utilisant les outils disponibles et la mémoire accumulée.

Apprendre — Après les tâches nécessitant cinq appels d'outils ou plus, générer un fichier de compétence Markdown résumant l'approche, les cas limites et les connaissances du domaine.

Améliorer — Stocker la compétence dans SQLite avec indexation FTS5 en texte intégral ; la récupérer et l'appliquer lors de tâches similaires futures.

Ce n'est pas une promesse marketing. La boucle d'apprentissage est un système concret et inspectatble. SQLite stocke les compétences avec une indexation de recherche en texte intégral, ce qui rend la récupération rapide et déterministe. Les fichiers de compétences sont de simples fichiers Markdown — vous pouvez les lire, les modifier et les versionner comme n'importe quel code.

La mémoire en trois couches

Hermes répartit la mémoire en trois couches distinctes :

Couche 1 — Instantané utilisateur : Un profil persistant de vos préférences, votre style de travail et vos objectifs à long terme. Mis à jour en continu entre les sessions.

Couche 2 — Historique des sessions : Chaque conversation stockée dans SQLite FTS5 avec recherche sémantique. L'agent peut rappeler ce qu'il vous a dit il y a six semaines, l'approche adoptée pour une tâche similaire, ou les erreurs rencontrées.

Couche 3 — Fichiers de compétences : Connaissances procédurales capturées sous forme de fichiers Markdown après des tâches complexes. 118 compétences intégrées sont livrées avec le framework ; 647 autres sont disponibles dans l'écosystème communautaire.

Cette architecture signifie que Hermes ne souffre pas d'amnésie entre les sessions. Il sait ce qu'il a appris, et sait où le retrouver.

Démarrage rapide

Hermes est livré avec un installateur en une seule commande qui gère tous les prérequis automatiquement sur Linux, macOS et WSL2 :

curl -fsSL https://hermes-agent.org/install.sh | bash

Une fois installé, lancez l'agent :

hermes

Il se connecte par défaut à votre serveur de modèle local — LM Studio, Ollama ou llama.cpp. Pour les modèles cloud, définissez votre clé API :

export ANTHROPIC_API_KEY=your_key_here
hermes --model claude-sonnet-4-6

Hermes fonctionne avec pratiquement n'importe quel modèle : Claude Sonnet 4.6, la série Qwen 3.6, MiMo-V2-Pro, et des dizaines d'autres. Le framework est agnostique au fournisseur par conception.

Modèles recommandés

Pour le déploiement local, Nous Research et NVIDIA recommandent la série Qwen 3.6 :

Qwen 3.6-35B : fonctionne sur environ 20 Go de VRAM tout en dépassant les performances des modèles à 120 milliards de paramètres dans les benchmarks d'agents
Qwen 3.6-27B : atteint la précision des modèles à 400 milliards de paramètres à 1/16ème de la taille — idéal pour les stations de travail RTX et NVIDIA DGX Spark

Le modèle 35B est le juste milieu pour la plupart des développeurs : excellent raisonnement, exigences VRAM raisonnables et assez rapide pour une utilisation interactive.

Pour les déploiements cloud, Claude Sonnet 4.6 et Gemini 3.5 Flash sont tous deux officiellement supportés et bien testés dans les déploiements Hermes en production.

v0.13.0 "Tenacity" — Ce qui a changé

Publié le 7 mai 2026, la version 0.13.0 "Tenacity" a été construite par 295 contributeurs sur 864 commits. Les ajouts clés comprennent :

Tableaux Kanban : gestion visuelle des tâches intégrée directement dans l'interface de l'agent
Suivi des objectifs persistant : les objectifs survivent aux redémarrages de session et se chargent automatiquement dans le contexte
8 correctifs de sécurité : correction de CVE dans la couche d'exécution des sous-processus et le parseur de fichiers de compétences
Plus de 20 intégrations de messagerie : WhatsApp, Telegram, Discord, Slack et plus encore via une passerelle unifiée
Isolation des sous-agents : les sous-agents contenus utilisent désormais des fenêtres de contexte ciblées, réduisant les hallucinations dues au débordement de contexte

Pourquoi Hermes a dépassé OpenClaw

La comparaison des classements OpenRouter illustre clairement la situation au 10 mai 2026 :

Agent	Tokens quotidiens
Hermes Agent	224 Mrd
OpenClaw	186 Mrd
Kilo Code	149 Mrd
Claude Code	79.2 Mrd

OpenClaw maintient son avance en tokens cumulatifs (9,17 billions contre 6,35 billions pour Hermes) et en étoiles GitHub totales (370 000+). Mais la vélocité quotidienne de Hermes indique où se passe le développement nouveau. Les développeurs choisissent Hermes pour de nouveaux workflows, et l'écart se creuse.

L'endossement xAI/Grok a été un tournant décisif : xAI a publiquement désigné Hermes Agent comme le framework d'agent open source recommandé pour les utilisateurs de Grok. NVIDIA a suivi avec un article de blog dédié sur l'exécution de Hermes sur du matériel RTX et DGX Spark.

L'argument business pour les équipes

Pour les équipes de développement évaluant Hermes face aux alternatives propriétaires :

Les données restent en local : les compétences, la mémoire et l'historique des sessions ne quittent jamais votre infrastructure. Pour les cas d'usage entreprise impliquant du code propriétaire, des données clients ou des secteurs réglementés, le déploiement local n'est pas optionnel.

Pas de licence par siège : la licence MIT signifie que vous pouvez déployer, forker et modifier sans négociation avec un fournisseur. Le plancher de coût, c'est votre propre calcul.

Valeur cumulée : plus votre équipe fait fonctionner Hermes longtemps, plus il se spécialise dans votre stack, vos conventions et votre domaine. Cette bibliothèque de compétences accumulée vous appartient.

Développement actif : 864 commits dans une seule version, 295 contributeurs, près de 1 000 au total. La vélocité de développement est parmi les plus rapides dans l'IA open source en ce moment.

Conclusion

Hermes Agent atteignant la première place sur OpenRouter est plus qu'une statistique d'utilisation — c'est un signal que les développeurs sont prêts pour des agents qui apprennent véritablement. L'architecture est transparente, la licence est permissive, et la vélocité de la communauté est exceptionnelle.

Si vous attendiez un agent open source digne d'un déploiement en production, Hermes mérite une évaluation sérieuse. Commencez avec un modèle local, laissez-le tourner une semaine, et observez ce qu'il apprend.

Le dépôt GitHub est à github.com/NousResearch/hermes-agent. Les notes de version 0.13.0 sont détaillées, la documentation est maintenue, et la communauté répond rapidement.