マルチエージェントLLM討議における隠れたアンカー
本論文は、マルチエージェントLLM討議において各エージェントが持つ隠れた内部信念(アンカー)が集団意思決定に与える影響を説明する動的システムモデルを提案する。このモデルは、古典的なコンセンサスルールでは禁止される行動、すなわちエージェントの正解に対する確信度が初期信念の凸包を超える現象を説明する。3つのオープンウェイトモデルファミリーを用いた実験では、すべてのアンカーの影響力はほぼ同程度であるが、その位置が異なり、アンカーが初期意見から遠くにある場合にのみ討議が凸包を脱出することが示された。
最近、arXivに「Hidden Anchors in Multi-Agent LLM Deliberation」と題する研究論文が投稿されました。著者はApurba Pokharel氏とRam Dantu氏です。この研究は、マルチエージェント大規模言語モデル(LLM)の討議プロセスにおける内在的なメカニズムを説明するための新しい数学モデルを提案しています。
マルチエージェントLLM討議(複数のLLMエージェントが複数回にわたって回答を交換し修正することで合意に達するプロセス)は、推論能力と精度を向上させるために広く利用されていますが、その動作原理に関する理論モデルはほとんどありませんでした。研究チームは、この討議プロセスが人間の社会的意思決定と非常に似ていることに着目しました。社会的動物である私たちは、集団の影響(「群衆効果」、古典的な意見動力学モデルであるDeGrootモデルやFriedkin-Johnsenモデルで捉えられている)と、自身の内部信念の両方に引っ張られますが、後者は古典モデルでは無視されがちです。
このギャップを埋めるために、本研究ではマルチエージェント討議を閉ループ動的システムとしてモデル化しました。このシステムでは、各エージェントが「アンカー」と呼ばれる隠れた内部信念を持ち、それが近隣のエージェントとは無関係に継続的にエージェントの意見を引き寄せます。研究では、このアンカーが討議の観測データから回復可能であることを示しました。さらに、このモデルは古典的なコンセンサスルールでは禁止される行動を説明できます。すなわち、エージェントの正解に対する確信度がどのエージェントの初期水準よりも上昇し、初期信念が形成する「凸包」空間から脱出する現象です。
研究者らはさらに、回復されたアンカーが未見の討議実行を予測できるか(汎化能力)を調べることで、モデルが真にアンカー駆動であるかどうかを簡単にテストできると指摘しています。3つのオープンウェイトモデルファミリーを用いた実験では、アンカーの存在はスペクトル状であり、全か無かではないことが示されました。すべてのアンカーの影響力はほぼ同程度ですが、その位置は異なります。アンカーが初期意見から遠くにある場合にのみ、討議は凸包を脱出し、完全な閉ループモデルが必要となります。
この研究は、マルチエージェントLLMシステムの設計と最適化に重要な理論的視点を提供し、集団知能における個々の信念と集団的合意の複雑な相互作用を理解する助けとなります。論文は13ページ、6図、7表から構成され、arXivプレプリントサーバー(識別番号:2606.19494)に提出されています。