询问AI鸡肉搭配什么?答案取决于它是从食谱还是分子中学到的
Kaikaku.AI推出了Epicure模型,分别基于食谱和化学分子进行食材搭配。其中仅基于化学的模型在口味和营养分类上表现更佳,尽管并未直接训练这些信息。模型训练使用了414万份七种语言的食谱和FlavorDB风味数据库。
Kaikaku.AI 是一家位于伦敦的餐厅技术初创公司,最近推出了名为“Epicure”的三种AI模型。这些模型的核心区别在于训练数据不同。第一个模型“Cooc”仅学习食材在真实食谱中如何搭配;第二个模型“Chem”仅基于FlavorDB化学数据库,分析食材共享的风味分子;第三个模型“Core”则结合了这两者的信息。
为了构建这些模型,研究人员收集了来自11个来源的414万份食谱,涵盖七种语言,包括中文、俄语、越南语、土耳其语、印尼语和德语。他们使用基于Claude和Gemini嵌入的管道处理了约20万个原始术语,最终清理出1790种干净的食材。尽管英语语料库仍然占据主导,但这次的多语言尝试使得模型对不同菜系的食材关系有了更全面的理解。
当被问及“鸡肉搭配什么”时,不同模型给出了截然不同的答案。Cooc返回的是大蒜、洋葱和黑胡椒这些在食谱中常见搭配。Chem则推荐了牛肉或猪肉,因为它们的风味分子相似。对于“罗勒”,Cooc给出了欧芹、橄榄油和帕尔马干酪,而Chem推荐了牛至、龙蒿和迷迭香这些香料亲戚。
令人惊讶的是,基于化学的Chem模型在预测食材的甜、酸、苦等味道以及蛋白质、脂肪等营养价值方面表现最佳,尽管这些信息并未直接包含在训练数据中。研究人员认为,化学关系作为一种捷径,使模型能够隐含地学习到其他烹饪概念。
除了简单的邻居搜索,用户还可以通过可调角度将种子食材转向目标方向。例如,将“米饭”稍微转向南亚方向,就会出现咖喱叶、乌拉德豆、查纳豆和葫芦巴籽。将“巧克力”转向“甜糕点”方向,Cooc和Core给出的是西方烘焙食材,而Chem则指向东亚甜点集群,包括红豆沙、抹茶粉和紫薯。
这些模型背后的公司Kaikaku.AI运营着一家名为Common Room的机器人餐厅,并计划将其扩展为连锁店。他们的“Fusion”机器每小时可分配360碗食材,并配备了基于机器学习的库存管理系统。公司于2024年完成了约180万美元的种子轮前融资。
这项研究对于餐厅菜单开发、食材替代以及新地区扩张具有潜在价值。然而,模型在某些菜系(如南亚和拉丁美洲)上的表现可能不如东亚和西方菜系稳定,因为训练数据分布不均。此外,词汇清理依赖于语言模型,可能带有文化偏见。目前模型权重和数据集已在Hugging Face上公开,以便独立验证。