Google Cloud a présenté l'Open Knowledge Format (OKF) v0.1 le 12 juin 2026 — une spécification ouverte et neutre vis-à-vis des fournisseurs qui formalise la façon dont les organisations stockent et partagent leurs connaissances avec les agents IA, en utilisant simplement des fichiers markdown ordinaires avec un frontmatter YAML.
Points clés
- OKF standardise la connaissance organisationnelle sous forme d'un répertoire portable de fichiers markdown lisibles directement par les agents
- Un seul champ YAML obligatoire :
type— pas de SDK propriétaire, pas de compte fournisseur, pas de verrouillage - Disponible sur GitHub sous
GoogleCloudPlatform/knowledge-catalogavec trois bundles d'exemples et deux implémentations de référence - Résout directement le "problème d'assemblage de contexte" qui oblige chaque équipe IA à reconstruire l'intégration des connaissances from scratch
- Formalise le patron "LLM wiki" découvert par Andrej Karpathy en un standard ouvert interopérable
Le problème que résout OKF
Toute organisation qui construit des agents IA fait face à la même réalité douloureuse : la connaissance institutionnelle est fragmentée. Elle vit dans des wikis, enfouie dans des commentaires de code, verrouillée dans des API de catalogues de métadonnées, dispersée dans des drives partagés, et stockée dans la tête de quelques ingénieurs seniors.
Cette fragmentation oblige les constructeurs d'agents à résoudre le même défi d'intégration de données encore et encore avant que leurs agents puissent fonctionner intelligemment. OKF vise à mettre fin à ce cycle en établissant un format neutre et portable que tout le monde peut produire sans SDK — et que tout le monde peut consommer sans intégration fournisseur.
Sam McVeety (Tech Lead, Data Analytics, Google Cloud) et Amir Hormati (Tech Lead, BigQuery, Google Cloud) ont rédigé la spécification, s'inspirant du patron "LLM wiki" qui a émergé organiquement parmi les équipes qui construisent des bases de connaissances internes pour leurs agents IA.
Comment fonctionne OKF
Au coeur du système, OKF représente la connaissance d'une organisation sous forme d'une arborescence de fichiers markdown :
- Chaque fichier représente un seul "concept" — une table de base de données, un endpoint API, une métrique, ou un runbook
- Un bloc minimal de frontmatter YAML étiquette le concept avec
type,title,description,resourceettags - Deux noms de fichiers réservés maintiennent la navigabilité des bundles :
index.mdénumère le contenu d'un répertoire ;log.mdenregistre l'historique des modifications avec des en-têtes de date ISO 8601 - Les liens croisés utilisent des liens markdown standard, rendant les relations lisibles par les humains et les agents
Le résultat est un bundle de connaissances qui vit dans le contrôle de version aux côtés du code, s'affiche sur GitHub, et ne nécessite aucun backend pour être hébergé. La spécification complète v0.1 tient en 451 lignes et 14,7 kilo-octets — intentionnellement compacte.
Le patron LLM Wiki de Karpathy formalisé en standard
La spécification formalise explicitement le patron "LLM wiki" — des équipes maintenant des bibliothèques markdown partagées que les agents lisent, mettent à jour et référencent mutuellement. Comme l'a noté Andrej Karpathy à propos de cette approche :
"Les LLM ne s'ennuient pas, n'oublient pas de mettre à jour une référence croisée, et peuvent toucher 15 fichiers en une seule passe. La bureaucratie qui pousse les humains à abandonner les wikis personnels est exactement ce que les LLM font bien."
En standardisant ce patron découvert par la communauté, Google Cloud vise à empêcher les organisations de construire des silos de connaissances incompatibles au fur et à mesure qu'elles font évoluer leurs systèmes agentiques.
Ce que contient la version v0.1
Le dépôt GitHub (GoogleCloudPlatform/knowledge-catalog) comprend :
- La spécification OKF v0.1 complète — minimalement prescriptive, seul le champ
typeest requis - Agent d'enrichissement — parcourt les datasets BigQuery, rédige des documents OKF pour les tables et vues, les enrichit avec des citations, des schémas et des chemins de jointure
- Visualiseur HTML statique — convertit les bundles OKF en vues graphiques interactives sans backend requis
- Trois bundles d'exemples — données GA4 e-commerce, datasets publics Stack Overflow, et données publiques Bitcoin, tous produits par l'agent de référence
Pourquoi cela importe pour les constructeurs d'agents
Le minimalisme d'OKF est un choix de conception délibéré. Plutôt que de standardiser les taxonomies, l'infrastructure de stockage, ou les schémas spécifiques à un domaine, il fournit juste assez de structure pour que les agents naviguent et consomment les connaissances de manière fiable.
Cela positionne OKF comme un format, pas une plateforme — pas de verrouillage fournisseur, pas de comptes propriétaires, pas de chemin de migration forcé. Les organisations peuvent l'adopter de manière incrémentale, en commençant par un seul dataset et en s'élargissant à mesure que leurs écosystèmes agentiques grandissent.
Pour les organisations de la région MENA qui construisent des agents sur du contenu en arabe ou des données d'entreprise multilingues, le design d'OKF natif markdown et agnostique en matière d'encodage est particulièrement pertinent : le format n'impose aucune contrainte au niveau de la langue sur le contenu des documents.
Et ensuite ?
La version v0.1 se décrit explicitement comme un point de départ. Google Cloud invite la communauté à écrire des producteurs et des consommateurs, à proposer des extensions, et à soumettre des pull requests via GitHub. Une croissance rétrocompatible est intégrée dans la philosophie de conception de la spécification.
Google Cloud Knowledge Catalog a déjà été mis à jour pour ingérer nativement les bundles OKF, offrant aux équipes d'entreprise un chemin d'intégration immédiat — mais la nature ouverte de la spécification signifie que n'importe quel framework d'agents peut l'adopter indépendamment.
Source : Google Cloud Blog