Anthropic divulgue accidentellement Claude Mythos, son modèle IA le plus puissant

Anthropic a confirmé tester un nouveau modèle IA puissant appelé Claude Mythos après une fuite de données ayant accidentellement exposé des documents internes décrivant ses capacités. La société a reconnu que le modèle représente "un bond en avant" en performance IA et constitue "le plus performant jamais construit".

Ce qui est arrivé

Une erreur de configuration dans un des systèmes de gestion de contenu (CMS) externes d'Anthropic a laissé près de 3 000 fichiers non publiés — incluant des brouillons de billets de blog, des images, des PDF et des articles de recherche — dans un cache de données accessible au public. Le CMS configurait par défaut les fichiers téléchargés en accès public sauf restriction explicite, permettant à toute personne dotée de connaissances techniques de consulter et récupérer les documents sans authentification.

Fortune a découvert et signalé la fuite jeudi soir. Anthropic a ensuite sécurisé les données exposées et attribué le problème à "une erreur humaine dans la configuration du CMS".

Qu'est-ce que Claude Mythos ?

Selon les brouillons divulgués, Claude Mythos introduit un nouveau niveau de modèle appelé Capybara — positionné au-dessus du niveau Opus existant. Le document le décrit comme "un nouveau nom pour un nouveau niveau de modèle : plus grand et plus intelligent que nos modèles Opus".

Par rapport à Claude Opus 4.6, le modèle phare actuel d'Anthropic, le modèle Mythos de niveau Capybara obtient "des scores considérablement plus élevés" aux tests de :

Programmation — améliorations significatives dans les tâches de codage
Raisonnement académique — performances supérieures sur les benchmarks de raisonnement complexe
Cybersécurité — très en avance sur tout autre modèle IA en capacités cyber

Les inquiétudes en cybersécurité

Le détail le plus frappant de la fuite est sans doute la propre évaluation d'Anthropic des capacités du modèle en cybersécurité. Un brouillon de billet de blog indiquait que Claude Mythos est "actuellement très en avance sur tout autre modèle IA en capacités cyber" et "annonce une vague à venir de modèles capables d'exploiter des vulnérabilités de manières qui dépassent largement les efforts des défenseurs".

Dans le cadre du Preparedness Framework d'Anthropic, le modèle a été classé comme ayant une "haute capacité" pour les tâches de cybersécurité — une classification qui a déclenché une approche de déploiement prudente.

Stratégie de déploiement

Anthropic prévoit un déploiement progressif et délibéré plutôt qu'un lancement public large. La stratégie initiale se concentre sur :

Un accès anticipé pour des clients sélectionnés
Du temps accordé aux défenseurs cyber pour se préparer
Une disponibilité limitée en raison des coûts opérationnels élevés du modèle

Aucun calendrier pour une disponibilité publique générale n'a été annoncé.

Le sommet des PDG

Le même cache de documents exposés a révélé les détails d'une retraite exclusive sur invitation pour PDG dans la campagne anglaise. Organisé dans un manoir du XVIIIe siècle reconverti en hôtel, l'événement proposera des démonstrations de capacités inédites de Claude à ce qu'Anthropic décrit comme "les dirigeants les plus influents d'Europe", avec la participation prévue du PDG Dario Amodei.

La réponse d'Anthropic

Un porte-parole d'Anthropic a confirmé que la société développe "un modèle polyvalent avec des avancées significatives en raisonnement, programmation et cybersécurité", tout en soulignant une planification délibérée du déploiement. La société s'est empressée de préciser que la fuite est "sans rapport avec Claude, Cowork ou tout outil IA d'Anthropic" et qu'aucune "infrastructure centrale, système IA, donnée client ou architecture de sécurité" n'a été compromise.

Ce que cela signifie

Cette divulgation accidentelle place Anthropic — une entreprise qui a bâti sa réputation sur la sécurité de l'IA — dans une position inconfortable. L'ironie d'un laboratoire axé sur la sécurité exposant ses documents les plus sensibles via une simple erreur de configuration CMS n'a pas échappé à l'industrie.

Plus largement, la fuite confirme le rythme rapide de progression des capacités de l'IA. Si les évaluations internes d'Anthropic sont exactes, Claude Mythos représente un bond générationnel qui pourrait redéfinir le potentiel et les risques des systèmes IA de pointe.

Source : Fortune