Google Cloud 的 OKF 标准化 AI 可读知识

The Decoder··作者 Matthias Bastian

关键信息

OKF v0.1 故意保持极简:它只要求一个 frontmatter 字段“type”,而 title、description、resource、tags 和 timestamps 等字段都是可选的。文档通过标准 Markdown 链接相互连接,形成知识图谱,整体包可以在编辑器中阅读、在 GitHub 上渲染,并被搜索工具索引。

资讯摘要

Google Cloud 正在推出 Open Knowledge Format,也就是 OKF,作为面向 AI 代理的新型知识打包方式。这个格式把知识标准化为由 Markdown 文件和 YAML frontmatter 组成的目录,从而让它可以在不同系统之间移植。Google 将 OKF 描述为对最近流行起来的“LLM wiki”模式的一种更具互操作性的实现。0.1 版的规范刻意保持极简,只要求一个字段 type,而把大部分结构留给内容生产者决定。可选元数据可以包括 title、description、resource、tags 和 timestamps 等。

概念之间通过普通的 Markdown 链接关联起来,使一组文档能够表现得像一个知识图谱。Google 表示,这样的 bundle 既能在任何编辑器里给人阅读,也能在 GitHub 上渲染,还能被通用索引工具搜索。除了规范本身,Google Cloud 还发布了若干参考实现,例如用于 BigQuery 表的增强代理、静态 HTML 可视化器,以及面向 GA4 电商、Stack Overflow 和 Bitcoin 数据集的示例 bundle。Google Cloud 还更新了 Knowledge Catalog,使其能够摄取 OKF 并向代理提供这些知识,而规范和代码也已经发布在 GitHub 上。

Google Cloud 的 OKF 标准化 AI 可读知识

资讯正文

Google Cloud 的 Open Knowledge Format 将零散文档转化为供 AI 代理使用的 Markdown 文件

Google Cloud 正在推出 Open Knowledge Format(OKF),这是一项新的规范,旨在将知识标准化为 Markdown 文件,并使其能够跨系统迁移。

它借鉴了 Andrej Karpathy 近期推广的“LLM wiki”模式,并将其转化为一种可互操作的格式。OKF v0.1 将知识表示为一个包含 YAML frontmatter 的 Markdown 文件目录。该规范非常精简:只有一个必填字段(“type”),以及少量可选字段,例如 title、description、resource、tags 和 timestamps,除此之外的内容都写在 Markdown 正文中。

概念之间通过标准 Markdown 链接相互关联,从而形成一个知识图谱。OKF bundle 在任何编辑器中都可读,可在 GitHub 上正常渲染,并且可以被任何搜索工具索引。

碎片化知识拖慢 AI 代理的速度

大多数组织都知道 OKF 试图解决的问题。知识分散在元数据目录、wiki、代码注释、笔记本单元以及各个工程师的脑中。当 AI 代理需要为某个特定数据集编写 SQL 查询时,它必须从所有这些来源中拼凑碎片信息。

据 Google Cloud 介绍,目前每个代理开发者都在从零解决这个上下文问题,而每家目录工具厂商也都在重复发明同样的数据模型。连接到编码代理的 Obsidian Vaults、AGENTS.md 和 CLAUDE.md 约定文件、数据团队中的“metadata as code”仓库,它们都遵循类似的模式。但 Google 表示,每种方案都是定制构建的,并不是为了彼此协作而设计的。知识仍然被锁定在创建它的系统里。这正是 OKF 试图填补的空白。

为简洁与可移植而生

OKF 只要求一个字段(“type”)。有哪些类型、文档包含哪些额外字段,以及正文如何组织,则由生产方决定。生产方和消费方是解耦的。人类编写的 bundle 可以被 AI 代理消费,机器生成的 bundle 也可以在可视化工具中查看。OKF 可与任何云服务提供商、数据库或代理框架配合使用。

除了该规范之外,Google Cloud 还发布了多个参考实现。其中包括一个丰富化代理,它会抓取 BigQuery 数据集并为每张表创建一个 OKF 文档;一个静态 HTML 可视化器;以及三个示例 bundle,分别对应 GA4 电商、Stack Overflow 和 Bitcoin 数据集。

Google Cloud 还更新了其 Knowledge Catalog,使其能够摄取 OKF 并将其提供给代理使用。该规范和代码已在 GitHub 上发布。Knowledge Catalog 的集成说明则单独记录。

AI 新闻,无需炒作——由人类精选

订阅 THE DECODER,获得无广告阅读、每周 AI 新闻简报、我们独家的“AI Radar”前沿报告(每年六次)、完整历史归档访问权限,以及评论区访问权限。

来源与参考

  1. 原始链接
  2. Google Cloud's Open Knowledge Format turns scattered docs into Markdown files for AI agents

收录于 2026-06-15