AutoAgent : des agents IA open source qui se construisent eux-mêmes

Une nouvelle bibliothèque open source appelée AutoAgent fait sensation dans la communauté de l'intelligence artificielle. Son créateur, Kevin Gu, diplômé de Harvard et ancien chercheur chez Jump Trading, a démontré que les agents IA peuvent concevoir de meilleures versions d'eux-mêmes, surpassant toutes les soumissions conçues manuellement sur deux benchmarks majeurs.

Points clés

AutoAgent a atteint 96,5 % sur SpreadsheetBench et 55,1 % sur TerminalBench, les deux premières places
Toutes les autres entrées du classement étaient conçues manuellement par des humains ; AutoAgent ne l'était pas
La bibliothèque est entièrement open source sous licence MIT
Gu la décrit comme "l'équivalent d'AutoResearch, mais pour l'ingénierie des agents"

Comment ça fonctionne

AutoAgent introduit un méta-agent qui améliore automatiquement un agent de tâches grâce à une boucle d'optimisation par ascension de colline (hill-climbing). Au lieu qu'un développeur ajuste manuellement les prompts et les outils, le processus fonctionne ainsi :

Le développeur rédige une directive dans un fichier program.md décrivant l'objectif
Le méta-agent modifie la structure de l'agent : prompts système, outils, configuration et orchestration
Il exécute les benchmarks, vérifie le score, conserve les améliorations, rejette les régressions et recommence

Le cycle complet s'exécute pendant la nuit dans des conteneurs Docker isolés, garantissant la sécurité tandis que l'agent parcourt des milliers de simulations parallèles.

Architecture

Le projet repose sur trois composants fondamentaux :

agent.py — un fichier unique contenant la configuration, les définitions d'outils, le registre des agents et l'adaptateur Harbor
program.md — les instructions éditées par le développeur pour guider le méta-agent
tasks/ — des benchmarks d'évaluation au format Harbor pour une évaluation multi-jeux de données

Pourquoi c'est important

L'idée centrale d'AutoAgent est que les agents sont souvent meilleurs pour "voir comme un agent" et concevoir leurs propres espaces d'action que les développeurs humains. Cela fait évoluer le rôle du développeur : de l'ingénierie manuelle des prompts vers la définition de critères d'évaluation, en laissant l'IA déterminer l'approche optimale.

Plusieurs chercheurs éminents en IA ont souligné que cette approche pourrait transformer fondamentalement la façon dont les agents IA sont construits, passant de la conception artisanale de prompts à l'optimisation automatisée à grande échelle.

Réactions de la communauté

L'annonce a généré un engouement considérable sur X, certains développeurs se demandant si cela représente un pas vers l'intelligence artificielle générale (AGI). D'autres ont établi des parallèles avec le projet AutoResearch d'Andrej Karpathy, notant qu'AutoAgent applique la même philosophie d'auto-amélioration spécifiquement à l'ingénierie des agents.

Pour commencer

AutoAgent nécessite Docker, Python 3.10 ou supérieur et le gestionnaire de paquets uv. Il prend en charge plusieurs fournisseurs de modèles et est disponible dès maintenant sur GitHub sous licence MIT.

Et ensuite

Alors que le développement des agents IA s'accélère dans l'industrie, AutoAgent pourrait devenir un outil fondamental pour les équipes cherchant à optimiser les performances de leurs agents sans itération manuelle. Le projet est activement maintenu et la communauté explore déjà des applications au-delà des tâches de tableurs et de terminaux.

Source : AutoAgent sur GitHub