信頼性とロバスト性を備えたLLM計画に向けて:シンボリックフィードバック駆動型反復的自己精錬フレームワーク
大規模言語モデル(LLM)は長期計画タスクにおいて実行不可能または誤った解決策を生成することが多い。本論文では、自然言語プロンプト機構、シンボリック検証器、計画認識器を用いたシンボリックフィードバック駆動型反復的自己精錬フレームワークを提案し、LLM計画の実現可能性と正確性を大幅に向上させ、システムのロバスト性と信頼性を強化する。
近年、大規模言語モデル(LLM)は学界や産業界から広く注目を集めているが、その展開はロバスト性と信頼性に関する重要なセキュリティ上の懸念を引き起こしている。計画は知的行動の中核要素であるが、LLMにとっては依然として課題であり、内在する複雑性のために長期意思決定タスクでは実行不可能または誤った解決策を生成することが多い。例えば、ロボットのタスク計画や自動運転の経路計画において、LLMは物理的な制約や時間制限を無視し、実行不可能な計画を生成する可能性がある。このような信頼性の欠如は、LLMの現実世界への応用を大きく制限している。
この問題に対処するため、複数の研究機関の研究者らはシンボリックフィードバック駆動型反復的自己精錬フレームワークを提案し、長期計画におけるLLMのロバスト性と信頼性を強化する。このフレームワークは複数の革新的コンポーネントが連携して動作する。まず、自然言語プロンプト機構が論理記号(述語論理や時相論理など)を自然言語記述にマッピングし、LLMがタスクの制約とセマンティクスをより正確に捉えることを可能にする。これにより、記号の誤解によるエラーを防ぐ。次に、シンボリック検証器が設計され、計画内のエラー(例えば、アクションの前提条件が満たされていない、目標に到達できないなど)を特定し、それらをLLMが解釈可能な修正指示に変換して自己改善を導く。これらの指示は自然言語形式で提供される。さらに、計画認識器を活用して目標の到達可能性を推論し、到達不可能な目標に計算リソースを浪費することなく、所望の目標に向けてより効果的なガイダンスを提供する。
実験結果は、提案されたフレームワークが長期計画タスクにおいて計画の実現可能性と正確性を一貫して向上させることを示している。ベースライン手法と比較して、複数のベンチマークで顕著な改善が見られ、特に多段階の推論と制約充足が必要な複雑なシナリオで効果を発揮した。この成果は、LLMベースの計画の信頼性を高める上でのフレームワークの有効性を強調し、より信頼できるAIシステムの構築につながる可能性を示している。論文の著者はJiajing Zhangら6名で、論文番号はarXiv:2606.27757、2026年6月26日に提出された。この研究は、ロボット工学、自動運転、自動計画などの安全重要な分野におけるLLMの展開に新たな道を開くものである。