チキンに合うものをAIに尋ねると、答えはレシピから学んだか分子から学んだかによって変わる
Kaikaku.AIは、レシピベースと化学ベースの食材ペアリングを分離したEpicureモデルを発表。化学ベースのモデルは、味や栄養の分類において直接的な学習なしに優れた性能を発揮。414万レシピとFlavorDBで訓練。
Kaikaku.AIはロンドンを拠点とするレストランテクノロジーのスタートアップで、最近「Epicure」と呼ばれる3つのAIモデルを発表した。これらのモデルは訓練データの違いにより区別される。最初のモデル「Cooc」は実際のレシピの中で食材がどのように組み合わされているかのみを学習する。2番目の「Chem」はFlavorDB化学データベースに基づき、食材が共有するフレーバー分子のみを考慮する。3番目の「Core」は両方を組み合わせている。
モデル構築のために、研究者たちは11のソースから414万のレシピを収集し、7言語(中国語、ロシア語、ベトナム語、トルコ語、インドネシア語、ドイツ語を含む)にわたるコーパスを作成した。ClaudeとGeminiの埋め込みを用いたパイプラインで約20万の生の用語を処理し、1790のクリーンな食材に整理した。データは東アジアのソースが約半分を占め、ラテンアメリカ、東ヨーロッパ、南アジアはそれぞれ一桁のパーセンテージにとどまる。
「チキンに合うものは?」という質問に対して、Coocはニンニク、タマネギ、黒コショウを返す。Chemは牛肉や豚肉を推奨する。バジルでは、Coocはパセリ、オリーブオイル、パルメザンチーズを、Chemはオレガノ、タラゴン、ローズマリーを提案する。
Chemモデルは、甘味、酸味、苦味などのフレーバーやタンパク質、脂肪含有量といった栄養価の分類において、他のモデルよりも優れている。これらの情報は訓練データに直接コード化されていないにもかかわらず、である。化学的関係が暗黙のショートカットとして機能し、他の料理概念にも調整されるようだ。
ユーザーは単純な近傍検索に加え、シード食材を調整可能な角度でターゲット方向にシフトできる。例えば、「米」を南アジア方向に少し回すと、カレーリーフ、ウラドダル、チャナダル、フェヌグリークシードが現れる。「チョコレート」を「甘いペストリー」方向に回すと、CoocとCoreは西洋のベーキング食材を、Chemは紅茶餡、抹茶パウダー、紫芋を含む東アジアのデザートクラスターを示す。
この研究の背後にあるKaikaku.AIは、ロボットレストラン「Common Room」を運営し、ML搭載の在庫管理システムと3Dプリントされた食品対応部品を備えた「Fusion」マシンを使用している。2024年に約180万ドルのプレシードラウンドを調達した。
モデルはメニュー開発、代替食材の提案、新しい地域への展開などに役立つ可能性がある。しかし、訓練データの分布が偏っているため、南アジアやラテンアメリカ地域では回答が不安定になる可能性がある。語彙のクリーニングは言語モデルの出力に依存しており、文化的バイアスが含まれる可能性もある。モデルの重みとデータセットはHugging Faceで公開されており、独立した検証が可能である。