AI News HubLIVE
サイト内リライト4 分で読了

人と機械のゲーム:戦略的推論を解きほぐしてAIを前進させる

MIT助教授のGabriele Farinaは、複雑なマルチエージェントシナリオにおける意思決定の基礎を研究し、ゲーム理論と機械学習を組み合わせて、ブラフや交渉ができるAIを開発。低コストで戦略ゲームStrategoにおいて人間のトッププレイヤーを打ち負かしました。

ソースMIT News AI著者: Michaela Jarvis | MIT Laboratory for Information and Decision Systems

Gabriele Farinaは、イタリア北部の丘陵地帯にあるワイン産地の小さな町で育ちました。両親は大学の学位を持っていませんでしたが、二人とも「数学はわからない」と確信していたものの、Farinaが欲しがった技術書を買い与え、古典科ではなく理科系の高校に進むことを妨げませんでした。14歳頃、Farinaは後に彼のキャリアの基盤となるアイデアに焦点を当てました。「機械が人間よりもはるかに優れた予測や決定を下せるという考えに、私は非常に早い段階で魅了されました。人間が作った数学やアルゴリズムが、ある意味で創造者を凌駕するシステムを生み出せるという事実は、すべてが単純な構成要素の上に成り立っているにもかかわらず、常に私に畏敬の念を与えてきました。」16歳のとき、Farinaは13歳の妹と遊んでいたボードゲームを解くコードを書きました。「私は何度もゲームを繰り返して最適な手を計算し、妹に、私たちのどちらもまだ見えないずっと前に彼女がすでに負けていたことを証明しました」とFarinaは述べ、妹は彼の新しいシステムにそれほど熱心ではなかったと付け加えています。現在、FarinaはMITの電気工学・コンピュータ科学科(EECS)の助教授であり、情報・意思決定システム研究所(LIDS)の主任研究員です。彼はゲーム理論の概念を機械学習、最適化、統計などのツールと組み合わせて、意思決定のための理論的およびアルゴリズム的基盤を前進させています。ミラノ工科大学で学部課程を履修したFarinaは、自動化および制御工学を学びました。しかし、時間が経つにつれて、彼の興味を引きつけたのは「既知の技術を適用することではなく、その基礎を理解し拡張すること」だと気づきました。「私は徐々に理論へとシフトしていきましたが、同時にその理論の具体的な応用を示すことにも深く関心を持ち続けました。」ミラノ工科大学での指導教官であるNicola Gatti教授(コンピュータ科学・工学の教授・研究者)は、Farinaに計算ゲーム理論の研究課題を紹介し、博士課程への出願を勧めました。当時、Farinaは直近の家族で初めて大学の学位を取得した者であり、イタリア(博士号の扱いが異なる)に住んでいたため、博士号が何であるかさえ知らなかったと述べています。それでも、学部を卒業して1か月後、Farinaはカーネギーメロン大学でコンピュータ科学の博士課程を開始しました。そこで彼は研究と論文で優秀な成績を収め、Facebook Economics and Computation Fellowshipも受賞しました。博士号を取得する直前、FarinaはMetaのFundamental AI Research Labsで1年間研究科学者として働きました。彼の主要プロジェクトの1つは、同盟を結んだり、交渉したり、他のプレイヤーがブラフしているかどうかを検出するゲームで人間プレイヤーに勝つことができるAI「Cicero」の開発を支援することでした。Farinaは、「Ciceroを構築したとき、自分にとって利益にならない同盟には同意しないように設計しました。また、相手が提案を実行することが自分たちのインセンティブに反する場合、そのプレイヤーが嘘をついている可能性が高いことを理解するようにしました」と述べています。2022年のMIT Technology Reviewの記事は、Ciceroが妥協を必要とする複雑な問題を解決できるAIへの進歩を表している可能性があると述べました。Metaでの1年後、FarinaはMITの教員に加わりました。2025年には、National Science Foundation CAREER Awardを受賞しました。彼の研究は、ゲーム理論と、異なる目的を持つ当事者間で何が起こるかを記述する数学的言語に基づいており、「均衡」(誰も戦略を変える理由がない状態)を定量化します。その目標は、均衡の計算に10億年かかる可能性がある大規模で複雑な現実世界のシナリオを単純化することです。「私は、最適化とアルゴリズムを使ってこれらの安定点を効率的に見つける方法を研究しています。私たちの研究は、理論の数学的基盤に新たな光を当て、これらの複雑な動的システムをより適切に制御・予測し、これらのアイデアを大規模なマルチエージェント相互作用に対する良好な解の計算に利用しようとしています。」Farinaは特に「不完全情報」の設定に興味を持っています。これは、一部のエージェントが他の参加者に知られていない情報を持っていることを意味します。そのようなシナリオでは、情報には価値があり、参加者は情報を漏らして価値を減らさないように、自分が持っている情報に基づいて戦略的に行動する必要があります。日常的な例はポーカーゲームで見られ、プレイヤーは手札の情報を隠すためにブラフをかけます。Farinaによれば、「私たちは今や、機械が人間よりもはるかにブラフが上手な世界に生きています。」「大量の不完全情報」を伴う状況が、Farinaを再びボードゲームの原点に戻しました。Strategoは軍事戦略ゲームであり、人間プレイヤーを打ち負かすシステムを生み出すために数百万ドルの研究努力が行われてきました。Farinaによれば、Strategoは複雑なリスク計算と誤誘導(ブラフ)を必要とし、おそらく主要な取り組みが超人的なパフォーマンスを生み出せなかった唯一の古典的なゲームでした。新しいアルゴリズムと、数百万ドルではなく1万ドル未満のトレーニングコストで、Farinaと彼の研究チームは史上最高のプレイヤーを打ち負かしました——15勝4引き分け1敗という結果です。Farinaは、これほど経済的な方法でそのような結果を出せたことに興奮していると述べ、「これらの新しい技術が将来のパイプラインに組み込まれることを期待しています」と語っています。「私たちは、大きなアクション空間や不完全情報にもかかわらず、戦略的に推論し、健全な決定を下すアルゴリズムの構築に向けて着実な進歩を目撃してきました。これらのアルゴリズムが、私たちの周りで起こっているより広範なAI革命に組み込まれるのを見るのが楽しみです。」