écrits/news/2026/06
News27 juin 2026·6 min

AWS Lambda MicroVMs : des bacs à sable Firecracker conçus pour les agents IA

AWS a lancé Lambda MicroVMs, une primitive serverless qui exécute le code généré par l'IA et par les utilisateurs dans des bacs à sable Firecracker isolés et persistants pendant jusqu'à huit heures. Ce lancement s'attaque directement au marché bâti par des startups comme E2B et Daytona.

AWS a dévoilé le 22 juin 2026 Lambda MicroVMs, une nouvelle primitive serverless destinée à exécuter le code généré par les utilisateurs ou par l'IA dans des environnements d'exécution isolés et persistants. Bâti sur Firecracker — la même technologie de virtualisation légère qui sous-tend déjà plus de 15 000 milliards d'invocations Lambda par mois — le service offre aux développeurs une isolation au niveau de la machine virtuelle, un lancement et une reprise quasi instantanés, et des sessions pouvant rester actives jusqu'à huit heures, le tout sans aucune infrastructure à gérer.

Ce lancement compte parce que le « bac à sable pour agents IA » est discrètement devenu l'une des couches les plus disputées de l'écosystème de l'IA. À mesure que les agents écrivent et exécutent leur propre code, chaque assistant de programmation, agent d'analyse de données et scanner de vulnérabilités a besoin d'un endroit sûr pour faire tourner des sorties non fiables. AWS vient de livrer cette primitive comme une brique de base de première partie.

Points clés

  • Lancé le 22 juin 2026 comme nouveau mode d'exécution d'AWS Lambda, propulsé par les micro-machines virtuelles Firecracker.
  • Isolation au niveau de la machine virtuelle — chaque MicroVM s'exécute dans une machine virtuelle dédiée, sans noyau partagé, de sorte que le code non fiable ne peut atteindre ni les autres sessions ni l'hôte.
  • Jusqu'à 8 heures d'exécution par session, avec une suspension automatique après une période d'inactivité configurable. Une fois suspendue, la facturation du calcul s'arrête tandis que l'état est préservé.
  • Plafonds de ressources allant jusqu'à 16 vCPU, 32 Go de mémoire et 32 Go de disque par MicroVM.
  • Modèle « image puis lancement » avec des instantanés Firecracker qui reprennent des environnements pré-initialisés plutôt que de démarrer à froid.

Comment ça fonctionne

Lambda MicroVMs repose sur une conception « image puis lancement ». Le développeur fournit un Dockerfile et un paquet de code sous forme d'archive zip dans Amazon S3. Lambda exécute le Dockerfile, initialise l'application, puis prend un instantané Firecracker de l'état de la mémoire et du disque de l'environnement en cours d'exécution. Chaque MicroVM lancée ensuite à partir de cette image reprend l'instantané pré-initialisé au lieu de démarrer de zéro — c'est ainsi qu'AWS obtient des démarrages quasi instantanés, même pour des sessions de plusieurs gigaoctets.

Puisque l'état survit à un cycle de suspension et de reprise, une tâche d'agent de longue durée peut se mettre en pause lorsqu'elle est inactive et reprendre exactement là où elle s'était arrêtée, sans payer le calcul entre-temps. Cette combinaison — persistance de l'état et facturation uniquement à l'exécution — est l'argument sur lequel AWS mise le plus.

Conçu pour les agents IA

AWS positionne le service pour les assistants de programmation IA, les environnements de code interactifs, les plateformes d'analyse de données, les scanners de vulnérabilités et les serveurs de jeux exécutant des scripts fournis par les utilisateurs. L'entreprise a également publié un guide pour utiliser les MicroVMs comme moteur d'exécution des agents IA gérés via Anthropic Claude, signalant que les charges de travail d'agents sont une cible prioritaire et non un ajout secondaire.

Au lancement, Lambda MicroVMs est disponible sur l'architecture ARM64 (Graviton) dans les régions USA Est (Virginie du Nord et Ohio), USA Ouest (Oregon), Europe (Irlande) et Asie-Pacifique (Tokyo). La tarification suit un modèle de calcul à la seconde, à environ 0,0000276944 dollar par vCPU-seconde et 0,0000036667 dollar par Go-seconde, auxquels s'ajoutent le stockage des instantanés à 0,08 dollar par Go-mois et les frais standards de transfert de données.

Impact

La réaction de l'écosystème des bacs à sable a été immédiate. Le PDG de Render a qualifié Lambda MicroVMs de « premier clou dans le cercueil de toute startup centrée uniquement sur les bacs à sable » — une allusion à des entreprises comme E2B et Daytona, qui ont bâti leur activité précisément autour de la fourniture aux agents IA d'environnements isolés et jetables, dont beaucoup tournent eux-mêmes sur Firecracker. Avec AWS livrant la primitive même que ces fournisseurs vendent, la pression sur la différenciation des produits de bac à sable autonomes vient de s'intensifier nettement.

Les sceptiques ont également réagi. Certains ingénieurs ont fait valoir que « bac à sable », comme « serverless » avant lui, devient un terme marketing, et que la latence de démarrage à froid et le coût par vCPU font de Lambda MicroVMs un mauvais choix par défaut pour de nombreuses charges d'agents. Northflank, par exemple, publie des tarifs environ six fois moins chers par vCPU que le prix affiché de Lambda MicroVMs, et des développeurs faisant tourner des boucles d'agents sensibles à la latence ont noté que les temps de démarrage de Lambda pouvaient rester trop lents pour leurs cas d'usage.

Et ensuite

Pour la région MENA, la question la plus intéressante reste la résidence des données. Lambda MicroVMs a été lancé dans quatre régions, dont aucune au Moyen-Orient — les équipes en Tunisie ou dans le Golfe qui comparent le service à un Firecracker auto-hébergé ou à une startup de bac à sable devront donc prendre en compte l'endroit où le code généré par les agents et ses données s'exécutent réellement. Sous des cadres comme l'INPDP tunisien et la PDPL saoudienne, l'emplacement de l'environnement d'exécution est autant une décision de conformité qu'une décision de performance.

Ce qui est clair, c'est qu'exécuter en toute sécurité du code non fiable écrit par l'IA est passé d'une préoccupation de niche à une exigence par défaut pour construire des agents — et les hyperscalers le traitent désormais comme une infrastructure de base plutôt que comme un module tiers.


Source : AWS