Thousand Token Wood: 3Bモデルでマルチエージェント経済を出荷する
Build Small Hackathon で構築された、3Bパラメーターモデルを使用した小さなマルチエージェント経済シミュレーションのフィールドレポート。5匹の森の生き物が交易、蓄財、パニックを起こす。小さなモデルがリアルタイムシミュレーションを可能にし、設計された希少性とプロンプトエンジニアリングの重要性を示す。
Build Small Hackathon で、Lester Leong(AdmiralTaco)氏は「Thousand Token Wood」という小さなマルチエージェント経済シミュレーションシステムを構築しました。このシステムは、Qwen2.5-3Bモデルを使用して5匹の森の生き物(フクロウ、リスなど)が商品を取引し、蓄財し、パニックを起こす様子をシミュレートします。モデルはModal上のvLLMで提供され、Gradioアプリが可視化の窓口となっています。
このプロジェクトの核心は、小さなモデルがリアルタイムのマルチエージェントシミュレーションを可能にすることを示すことです。最先端の大規模モデルに比べて、小さなモデルはコストが低く、速度が速いため、各タイムステップで全エージェントが1回のバッチGPU呼び出しで意思決定を行うことができます。しかし、初期バージョンは希少性の欠如により失敗しました。生産が消費を上回り、すべての生物が自給自足であり、取引の理由がありませんでした。修正は3つの希少性メカニズムを導入することでした:食事の多様性(各食事で1種類の食物しか食べられない)、腐敗(生鮮食品は腐る)、冬の燃料危機(すべての生物が暖を取るために薪を燃やさなければならず、需要が時間とともに増加する)。薪の生産者は1匹だけであり、需要が供給を上回るため、薪の値段が上がり、木こりは裕福になり、他の生物は暖を競い合います。
希少性が整うと、3Bモデルの限界が明らかになりました。100%の呼び出しで有効なJSONを生成しましたが、経済的判断は弱く、例えばどんぐりを生産する生物がどんぐりの購入注文を出すということがありました。修正はより大きなモデルではなく、よりシャープなプロンプトでした。各エージェントに生産物と決して購入してはいけないものを指定し、不足している商品の正確なリストを計算し、1つの作業例を与えました。意思決定の質が向上し、生物は役割に従って取引を始めました。ループ全体は寛容なJSON解析と修復レイヤーで包まれており、不正な応答はシミュレーションをクラッシュさせる代わりにno-opに縮退します。
2つ目の教訓はウェルビーイングから来ました。最初は累積器としてモデル化しましたが、慢性的な不足によりすべての生物がラン全体でゼロになり、死のスパイラルが発生しました。これは見ていて楽しくなく、エージェントの不完全な最適化を罰するものでした。私はそれを平均回帰する気分として再定義し、生物が餌を与えられ暖かくなると回復し、決してゼロにならないようにしました。賭け金は小石、価格、ステータスにあり、飢餓にはありません。
このプロジェクトで最も気に入っている機能は、市場の歴史と結びついていることです。プレイヤーは「ウッド・レジェンド」を描くことができます。有名なエピソードを森の民話に書き換えたものです。チューリップ・マニアは「グレート・エーコン・マニア」に、南海バブルは「ホロー・ログ・トレーディング・カンパニー」に、1929年の銀行取り付けは「ウーナの財宝への取り付け」になります。
これらは単なるフレーバーテキストではありません。各レジェンドは実際のショックを発火させ、エージェントが反応します。あるランで「ウーナの財宝への取り付け」を描いたところ、フクロウの金庫が空だという噂が流れました。ウーナは蜂蜜を売却して小石を調達し始め、供給の洪水により蜂蜜価格は次のターンで10から3に暴落しました。銀行取り付けを書き換えたイベントが、エージェントに資産を売却させ、市場価格を動かしたのです。これはすべてスクリプト化されていませんでした。
その可視性のために、価格は動く必要がありました。当初、エージェントは私が示した参照価格をそのまま引用していたため、価格は固定されていました。修正は、各ラウンド後の残余需要と供給で市場参照価格を変動させることでした。大量の未約定買い注文は価格を押し上げ、供給過剰は価格を押し下げます。これにより、価格は希少性の間にトレンドを示し、バランスの取れた取引では安定します。
代表的な15ターンのラン(干ばつと冬の噂が途中で注入された)の結果は次の通りです:有効JSONアクション100%(75/75)、ターンあたりの取引数3~9(途切れなし)、蜂蜜価格は銀行取り付けレジェンド中に10から3に暴落、薪価格は冬の希少性で4から7に上昇、富の格差(ジニ係数)は0.14から0.38に拡大、最終的に木こりが最も裕福になり、蓄財屋は破産しました。
これらの動きの背後にある推論はすべてオープントレースデータセットに含まれています。各行は各生物の完全なプロンプト、生の応答、解析されたアクション、および内部思考です。
小さなモデルで構築するための教訓:ほとんどのエンジニアリングは、小さなモデルの信頼できるフォーマット出力と信頼できない推論のギャップを、スケールではなく構造とプロンプトで埋めることです。創発システムは設計された希少性を必要とします。豊富さは退屈です。そして、最も魅力的な小さなモデルのデモは、作り出されたドラマを必要としません。3世紀の市場の歴史がそれを備えており、3Bエージェントの評議会でそれを演じるのに十分でした。
小さなモデル、大きな冒険。Spaceをお試しください。