Cloudflare et xAI ont annoncé un partenariat stratégique qui ajoute la suite complète des modèles Grok — génération de texte, image, audio et vidéo — à Cloudflare AI Gateway. Confirmé le 4 juin 2026, l'annonce a suscité un intérêt immédiat dans la communauté des développeurs, le post de CloudflareDev ayant cumulé près de 500 000 vues en quelques heures.
Points clés
- Tous les modèles Grok (LLM, audio, image, vidéo) sont désormais accessibles via Cloudflare AI Gateway
- La facturation est gérée directement par Cloudflare — aucun compte xAI ni clé API séparée requis
- Les développeurs bénéficient de journaux unifiés, d'un cache, d'une limitation de débit et d'une observabilité centralisée pour tous les fournisseurs d'IA
- Compatible en mode remplacement direct avec les SDK OpenAI et Anthropic via un simple changement de point de terminaison
Modèles disponibles
"L'intégration couvre l'ensemble de la gamme Grok actuelle :"
- Grok 4.3 — Modèle textuel principal avec une fenêtre de contexte d'un million de tokens, supportant les entrées texte et image, les appels de fonctions et les sorties structurées. Tarif : 1,25 $ par million de tokens en entrée et 2,50 $ en sortie.
- Grok 4.20 Multi-Agent — Fenêtre de 2 millions de tokens conçue pour les workflows de recherche parallèles, à 2,00 $ le million en entrée et 6,00 $ en sortie.
- Grok 4.20 Reasoning / Non-Reasoning — Variantes de raisonnement par chaîne de pensée pour les tâches nécessitant une résolution étape par étape.
- Grok Build 0.1 — Modèle dédié au génie logiciel avec une fenêtre de 256K tokens, disponible depuis le 28 mai 2026, à 1,00 $ le million en entrée et 2,00 $ en sortie.
- Grok Imagine — Modèles de génération et d'édition d'images (variantes standard et haute fidélité).
- Grok Imagine Video — Capacités de génération et d'extension vidéo.
Fonctionnement technique
Les requêtes transitent par un point de terminaison Cloudflare unifié :
https://gateway.ai.cloudflare.com/v1/{account_id}/{gateway_id}/grok
Les développeurs utilisant déjà Cloudflare Workers, Pages, D1 ou R2 peuvent intégrer les modèles Grok avec un minimum de modifications de configuration. La gateway accepte les requêtes via cURL, le SDK OpenAI (JavaScript et Python) et le SDK Anthropic, en faisant un remplacement direct pour tout pipeline multi-modèles existant.
Impact pour les développeurs
Ce mouvement positionne Cloudflare comme une couche d'infrastructure IA de bout en bout. Plutôt que de gérer des clés API distinctes, des flux d'authentification séparés et des comptes de facturation différents pour chaque fournisseur, les développeurs disposent d'un plan de contrôle unique couvrant le routage des modèles, la journalisation des requêtes, la limitation de débit, le cache et la facturation consolidée.
Pour les équipes déjà dans l'écosystème Cloudflare, cela représente un coût d'intégration quasi nul pour accéder à l'ensemble de la famille Grok — y compris Grok Imagine Video 1.5 Preview, l'un des modèles de génération vidéo les plus performants disponibles actuellement via API publique.
Contexte
Cloudflare AI Gateway agrège déjà des modèles d'OpenAI, Anthropic, Google Gemini, DeepSeek et d'autres sous une interface unifiée. L'ajout de Grok élargit ce catalogue et offre aux équipes entreprises plus de flexibilité dans le choix des modèles selon les étapes de leurs pipelines, avec des arbitrages coût/contexte/latence gérables depuis un tableau de bord unique.
Ce partenariat fait suite à l'expansion rapide de la disponibilité API de Grok par xAI, et au lancement en bêta publique de Grok Build 0.1 le 28 mai, qui cible directement les tâches de génie logiciel face à GitHub Copilot et Cursor.
Perspectives
Avec la suite Grok complète disponible sur Cloudflare, l'adoption devrait s'accélérer auprès des équipes construisant des workflows multi-agents combinant raisonnement textuel, génération de code, analyse d'images et synthèse vidéo dans un pipeline unique — le tout via un seul compte de facturation.
Source : Documentation Cloudflare AI Gateway — fournisseur xAI