Pourquoi les agents IA perdent leur cohérence

Un agent IA peut répondre correctement à chaque question prise isolément et pourtant rater la tâche dans son ensemble. Il choisit le bon outil, écrit une étape sensée, prend une décision défendable — et quarante étapes plus tard, le résultat ne sert l'intention de personne. Cet écart entre des choix localement corrects et un résultat globalement correct est la raison la plus sous-estimée des échecs d'agents en production. Les chercheurs l'appellent l'incohérence globale, et une fois que vous savez la nommer, vous la voyez partout.

Ce n'est pas le même problème que « les projets d'agents IA échouent à cause de la dérive de périmètre et de mauvaises données ». Cela, c'est une histoire organisationnelle. Ici, l'histoire est technique : même un agent parfaitement cadré, alimenté par des données propres, dérive de sa trajectoire sur les tâches de longue durée. Comprendre pourquoi fait toute la différence entre une démo éblouissante et un système digne de confiance.

L'arithmétique brutale du travail en plusieurs étapes

Commençons par le calcul, car il fixe l'enjeu. Supposons un agent précis à 95 % sur chaque action prise séparément — vraiment impressionnant. Enchaînez dix de ces actions et le flux de travail ne réussit qu'environ 60 % du temps. Abaissez la précision par étape à 85 %, valeur encore respectable, et une tâche de dix étapes ne réussit qu'environ une fois sur cinq.

Le cumul est impitoyable. Plus l'horizon est long, plus un infime taux d'erreur par étape domine le résultat. C'est pourquoi des agents qui paraissent brillants dans des démos à un seul tour s'effondrent sur des flux réels couvrant des dizaines d'appels d'outils, de récupérations et de décisions. L'échec est structurel, non le signe d'un modèle faible.

Les cinq pièges de cohérence

L'incohérence globale n'est pas un bug unique, mais une famille de modes de défaillance partageant une même signature : chaque étape paraît correcte isolément. Cinq d'entre eux reviennent assez souvent pour mériter un nom.

1. L'engagement prématuré. L'évaluation étape par étape récompense ce qui semble le mieux maintenant, alors l'agent se verrouille sur un plan avant d'avoir assez d'informations. Un agent de recherche s'engage sur une seule requête, puis passe le reste de l'exécution à la défendre au lieu de la reconsidérer. Les choix myopes précoces sont amplifiés avec le temps plutôt que corrigés.

2. L'invalidation en cascade. Une mauvaise hypothèse en amont casse silencieusement tout l'aval. L'agent ne le remarque jamais, car chaque étape suivante est cohérente en interne avec la prémisse erronée. Quand les symptômes apparaissent, la cause racine est enterrée vingt étapes plus tôt.

3. L'aveuglement aux contraintes. Une limite réelle — un plafond budgétaire, une limite de débit, une règle métier — est ignorée jusqu'à ce qu'il soit trop tard pour la respecter. L'agent optimise la tâche qu'il imagine plutôt que les contraintes sous lesquelles il opère réellement.

4. L'amnésie de contexte. Les informations recueillies tôt sortent du contexte de travail. La qualité de récupération se dégrade au milieu des longs contextes (l'effet bien documenté du « perdu au milieu »), si bien que l'agent oublie une décision prise vingt étapes plus tôt et se contredit.

5. La dérive d'objectif. Des déviations de raisonnement cumulées déforment lentement l'objectif initial. Aucune étape n'est fausse en particulier, mais la destination se déplace en douce. On estime que les tests standards sous-évaluent la fréquence du phénomène de 20 à 40 %, car les sorties de l'agent restent fluides et plausibles tout du long.

La propriété dangereuse que partagent les cinq est qu'ils sont silencieux. Pas d'exception, pas de trace d'appel, pas d'erreur rouge. La qualité se dégrade de façon invisible, ce qui explique précisément pourquoi l'évaluation systématique compte plus que l'espoir que l'agent « ait l'air » fiable.

Raisonner n'est pas planifier

La cause racine remonte à la façon dont ces modèles sont entraînés. Un objectif de prédiction du jeton suivant biaise le système vers la complétion de motifs locaux — bien terminer la pensée en cours — plutôt que vers une planification logique globale sur toute la tâche. L'auto-attention est puissante mais limitée comme mémoire de travail pour un raisonnement séquentiel long.

C'est pourquoi les agents les plus performants séparent deux compétences que les plus faibles confondent : le raisonnement (savoir comment exécuter l'étape en cours) et la planification (savoir quelle séquence d'étapes atteint le but et comment réparer le plan quand la réalité diverge). Ce qui distingue un agent résilient n'est pas l'intelligence brute par étape. C'est la capacité à anticiper, à surveiller la progression et à s'adapter quand le monde ne correspond pas au plan initial.

Des patrons qui restaurent la cohérence

La bonne nouvelle : l'incohérence globale est un problème d'architecture, et les problèmes d'architecture ont des réponses d'ingénierie. Aucune n'exige un modèle plus intelligent — elles exigent un meilleur harnais autour de celui que vous avez.

Ancrez le premier plan. La qualité du plan initial agit comme une « ancre de plan » qui prévient les erreurs en cascade. Investissez de façon disproportionnée pour réussir l'étape un — une décomposition explicite en graphe orienté de sous-objectifs vaut mieux que de laisser l'agent improviser en avançant.

Décomposez et confinez. Les approches hiérarchiques comme la planification découplée des tâches scindent un travail en arbre ou graphe acyclique de sous-objectifs et confinent planification et replanification au nœud actif. Quand une branche échoue, le rayon d'impact reste dans ce sous-objectif au lieu d'empoisonner toute l'exécution.

Reformulez l'objectif à cadence régulière. Insérez des intervalles de reformulation pour que l'agent relise son objectif réel toutes les quelques étapes. Couplez cela à une synthèse hiérarchique toutes les dix à vingt étapes qui conserve la logique des décisions, les tâches accomplies, les contraintes ouvertes et l'état de l'objectif. Cela contre directement l'amnésie de contexte et la dérive d'objectif.

Replanifiez en boucle fermée. Les plans statiques se brisent dans des environnements non déterministes. La vérification et la réparation du plan à l'exécution — contrôler après chaque jalon si le plan tient encore et le réviser sinon — transforment un script fragile en processus adaptatif.

Vérifiez par le code, pas par l'intuition. Préférez les contrôles automatisés fondés sur le code à un LLM qui corrige sa propre copie. Validez les sorties structurées contre un schéma à chaque frontière entre la sortie d'un agent et le consommateur suivant, afin que les données hallucinées ou malformées soient interceptées tôt plutôt que propagées.

Ajoutez un disjoncteur. Empruntez le patron à trois états des systèmes distribués. FERMÉ : fonctionnement autonome normal ; OUVERT : escalade vers un humain ou un repli quand les seuils d'erreur ou de coût sont dépassés ; SEMI-OUVERT : test prudent avant reprise. Combinez-le à des limites strictes d'itération et à un budget de raisonnement pour qu'une boucle de réessai ne puisse pas brûler des milliers de dollars en silence.

Placez les humains aux moments décisifs. Les points de contrôle « humain dans la boucle » ont leur place aux actions coûteuses à annuler — transactions externes, écritures irréversibles, communications adressées aux clients — non à intervalles arbitraires. Concevez les points de contrôle selon l'ampleur de la conséquence, pas selon le nombre d'étapes.

Comment déployer

Traitez la résilience comme un programme par phases, non comme un interrupteur. Avant le déploiement, menez une analyse des modes de défaillance propre à votre tâche, vos données et vos outils. Le premier mois, bâtissez les fondations ingrates : observabilité, plafonds de coûts, disjoncteurs, validation de schéma et voies d'escalade humaine claires. Soumettez ensuite le système à un bac à sable adverse contre chacun des cinq pièges. Ce n'est qu'une fois les preuves réunies que vous devriez élargir l'autonomie graduellement — passant de la revue humaine totale à une supervision par exception à mesure que l'agent gagne la confiance.

À retenir

Les agents de longue durée échouent non parce qu'ils sont bêtes à une étape isolée, mais parce que la justesse locale ne se cumule pas d'elle-même en cohérence globale. Engagement prématuré, invalidation en cascade, aveuglement aux contraintes, amnésie de contexte et dérive d'objectif sont autant de symptômes du même fossé architectural entre raisonnement et planification. Comblez ce fossé avec des plans ancrés, une décomposition confinée, une reformulation périodique de l'objectif, une replanification en boucle fermée, une vérification par le code, des disjoncteurs et des points de contrôle humains bien placés — et vous convertissez une démo éblouissante mais fragile en un système qui garde sa forme sur toute la tâche.

Chez Noqta, nous construisons des agents IA et de l'automatisation pour les entreprises de Tunisie et de la région MENA avec exactement cette discipline : non la démo la plus tape-à-l'œil, mais le flux qui fonctionne encore à la quarantième étape. Si vous voulez des agents vraiment dignes de confiance en production, discutons-en.