AI 将食谱搭配与风味化学分开

The Decoder··作者 Jonathan Kemper

关键信息

Epicure 训练于来自 11 个来源、7 种语言的 414 万份食谱,且借助基于 Claude 和 Gemini 的清洗流程,把大约 20 万个原始术语整理为 1790 个干净的配料名称。这个语料库仍然不均衡,只有大约三分之一的配料直接锚定在化学数据库中,其余则通过相关配料间接继承化学信号。

资讯摘要

文章介绍了 Epicure,这是初创公司 Kaikaku.AI 推出的一个新配料模型,旨在把此前经常被混在一起的两种烹饪相似性区分开来。第一种是食谱共现,也就是哪些配料会在真实菜谱中一起出现;第二种是风味化学相似性,也就是哪些配料共享相同的分子和香气化合物。为验证这种差异,研究人员构建了三个几乎完全相同的模型:用于食谱共现的 Cooc、用于化学相似性的 Chem,以及结合两者的 Core。结果表明,相同的问题会得到明显不同的答案,例如输入 chicken 时,Cooc 会给出 garlic、onion 和 black pepper 这类常见搭配,而 Chem 则会返回 beef 或 pork 这类风味相近的食材。

输入 basil 时,Cooc 更像是给出 parsley、olive oil 和 parmesan 这样的食谱伙伴,而 Chem 则会给出 oregano、tarragon 和 rosemary 这样的草本亲缘食材。作者还表示,Chem 在一些训练数据中没有被直接编码的概念上表现更好,比如甜、酸、苦等风味属性,以及蛋白质和脂肪含量等营养属性,因为化学联系似乎提供了一种有用的捷径。Epicure 的语料来自 11 个来源、7 种语言的 414 万份食谱,包括中文、俄语、越南语、土耳其语、印尼语和德语。项目还提供了一个方向控制界面,用户可以把某个配料朝向目标菜系或概念移动,从而改变结果的文化风格。

AI 将食谱搭配与风味化学分开

资讯正文

问 AI 什么食材适合搭配鸡肉,答案取决于它是从食谱还是从分子中学到的

什么食材适合搭配某种原料?答案取决于你是在寻找食谱中的搭档,还是寻找风味上的近亲。此前的 AI 模型把这两种视角混在了一起。初创公司 Kaikaku.AI 在一项新研究中将两者分开。

在“Epicure”中,Jakub Radzikowski 和 Josef Chen 展示了三个几乎完全相同的 AI 模型。它们唯一的区别在于训练数据。第一个模型“Cooc”只看真实食谱中哪些食材会一起出现。第二个模型“Chem”只看食材共享了哪些风味分子,所依据的是 FlavorDB 化学数据库。第三个模型“Core”则把两者结合起来。

同一个问题,三个答案

这种差异会在具体查询中显现出来。输入“chicken”,Cooc 会返回 garlic、onion 和 black pepper,也就是在食谱中经常与鸡肉搭配出现的食材。Chem 则返回 beef 或 pork,这些食材具有相似的风味特征。对于“basil”,Cooc 会给出 parsley、olive oil 和 parmesan,这是一套典型的意大利面厨房常备组合。Chem 则会给出 oregano、tarragon 和 rosemary,也就是香草家族的近亲。

据作者称,这个由化学关系驱动的模型,在本不应拥有任何信息的领域里表现也更好。像甜、酸或苦这样的风味,以及蛋白质或脂肪含量这样的营养值,并没有直接编码进训练数据。然而,Chem 在这些维度上的食材分类,比其他变体更清晰。显然,这些化学关系起到了一种捷径作用,同时也把模型调校到了其他烹饪概念上。

多语言语料,而非以英语为主的数据

截至目前最完整的公开食材模型 FlavorGraph,是建立在英文食谱语料库之上的。相比之下,Epicure 处理的是来自 11 个来源、使用 7 种语言的 414 万道食谱。这些语言包括中文、俄语、越南语、土耳其语、印度尼西亚语和德语。一个基于 Claude 和 Gemini embeddings 的处理流水线,会把大约 20 万个原始术语——例如拼写变体、品牌名称和烹饪步骤说明——翻译并清理成 1790 个干净的食材条目。

不过,这个语料库的分布仍然不均衡。大约一半材料来自东亚来源,而拉丁美洲、东欧和南亚菜系各自只贡献了个位数百分比的内容。只有大约三分之一的食材是直接锚定在化学数据库中的。其余部分则通过相关食材间接获得化学信号。

一个用于调整方向的旋钮

完成后的模型有两种运行模式。第一种是简单的邻近搜索:哪些食材与某个给定食材最接近?第二种则允许用户把一个种子食材沿着可调节的角度朝某个目标方向移动。角度为零时,原始食材保持不变;角度达到 60 度时,目标邻域就会接管。

把“rice”稍微朝南亚方向旋转,便会出现 curry leaf、urad dal、chana dal 和 fenugreek seeds。把“chicken”更多地朝加工过的西大西洋风味料理方向旋转,则会得到 Cream of chicken soup、crescent rolls 和 ranch dressing,也就是美国典型的家常烹饪常备食材。

模型的选择甚至会决定答案来自哪种文化。把“chocolate”往“甜味糕点”方向移动,Cooc 和 Core 会落到可可、香草和泡打粉等西式烘焙原料上。Chem 则会落到一个东亚甜点簇上,包含红豆沙、抹茶粉和紫薯。模型的选择也决定了答案的文化归属。

作者正在打造机器人餐厅。

这项研究背后是一家餐饮科技初创公司。Kaikaku 于 2023 年在伦敦成立,运营着自己的机器人餐厅 Common Room,地点位于 Brunswick Centre,并计划将其扩展成连锁店。

该公司使用自家的机器学习系统来称量和分装食材。它的机器名为“Fusion”,理论上每小时可出餐 360 碗。该系统还包括由机器学习驱动的库存管理,以及 3D 打印的食品级组件。该公司在 2024 年完成了一轮 pre-seed 融资,筹集了约 180 万美元。

在这样的背景下,对一张可机器读取的食材世界地图产生兴趣就很合理了。这样一个模型如果能够按需在食谱搭配和风味亲缘之间切换,把食材跨菜系地翻译,或者沿着“脂肪多”或“发酵”之类的轴线进行移动,在多个场景都会很有用。它可以帮助碗装餐厅开发菜单,在供应短缺时提供替代建议,或者在扩展到新地点时提供辅助。

不过,这在实际中是否有效还有待观察。模型权重和数据集现在已在 Hugging Face 上公开,从原则上说可以进行独立验证。但论文中展示的例子都是经过挑选的。在南亚或拉丁美洲这类代表性稀少的区域,答案很可能远不如东亚和西方主流菜系那样稳定。

词汇清理也依赖于语言模型的输出,而这些模型本身带有文化偏见。某个模型变体的“甜味糕点”方向里,chocolate 最终和 matcha 靠得很近,这确实是个有趣的效果。但这并不能说明这种旋转在那些经过挑选的例子之外是否同样可靠。

合著者 Josef Chen 在 X 上将该模型宣传为“有史以来最大的多语言食品模型”,并称他们把“人类烹饪的一切压缩进了 2 兆字节”。该模型的旧版本可在 epicure.kaikaku.ai 上以演示形式访问。

来源与参考

  1. 原始链接
  2. Ask AI what goes with chicken and the answer depends on whether it learned from recipes or molecules

收录于 2026-06-01