Gemini Enterprise Agent PlatformのエージェンティックRAGで信頼性の高い応答を実現
Google ResearchとGoogle Cloudが共同で開発したエージェンティックRAGフレームワークは、複数のエージェントが協調して複雑な企業クエリを分解し、十分なコンテキストを反復検索してから信頼性の高い応答を生成します。標準RAGと比較して最大34%の精度向上を達成。
Google ResearchとGoogle Cloudは、複雑なエンタープライズクエリに対応する新しいエージェンティックRAG(検索拡張生成)フレームワークを発表しました。従来の単一ステップのRAGシステムは、複数のデータソースにまたがる多段階のクエリを処理するようには設計されていません。例えば、「Project Xで使用されているサーバーの仕様は?」という質問に対して、システムはProject Xに関するドキュメントを見つけるかもしれませんが、それらにはサーバーIDしか記載されておらず、そのIDを使って別のデータベースで仕様を検索するという2段階目の処理は行われません。その結果、情報がデータの「島」に分散しているため、部分的な回答や「見つかりません」という応答が返されることになります。
こうした課題に対処するため、今回導入された「エージェンティックRAG」は、計画、推論、データソースとの反復的な対話を行い、複雑なクエリを処理して信頼性と精度を向上させます。このフレームワークは、Google ResearchとGoogle Cloudの協力に基づいて開発され、Gemini Enterprise Agent Platform上でホストされるクロスコーパス検索機能として提供されます。他のマルチエージェントRAGフレームワークと同様に、複数のエージェントが連携して複雑なクエリに確実に回答しますが、他と異なるのは「Sufficient Context Agent」を組み込んでいる点です。これは、正確な回答に十分な情報があるかどうかを確認するための品質管理インスペクターのような役割を果たします。
Sufficient Context Agentは、応答を生成する前に3つのチェックを行います。まず、RAG Agentがデータベースから取得した実際のテキストチャンクを評価し、次にシステムが生成した「下書き」応答をレビューし、最後に欠落している情報を分析します。例えば、医師が患者の投薬、食事、アレルギーについて問い合わせた場合、最初の検索で投薬と食事の情報は見つかったがアレルギーに関する記述が見つからなかったとします。その場合、Sufficient Context Agentは「コンテキスト不足」のシグナルを発し、「発疹」や「有害事象」を具体的に検索するようフィードバックを生成します。これにより、情報が完全に揃うまで検索が繰り返され、モデルが推測に頼ることを防ぎます。
実験では、FramesQAデータセット(824のクエリと2,676のPDFドキュメントを含む)を使用して評価が行われました。標準のRAG(GoogleのRAG Engineを使用)と比較して、エージェンティックRAGは事実性データセットで最大34%の精度向上を達成しました。さらに、3つの無関係なデータセットを追加したクロスコーパス設定でも、システムは90.1%の正解率を維持し、レイテンシは平均3%以内に収まりました。これは、Planner Agentが4つのコーパスから適切なものを選択し、クエリを正しくルーティングできることを示しています。
この新機能は現在、Gemini Enterprise Agent Platformでパブリックプレビューとして提供されています。Googleは、高度なクエリ計画、ルーティング、および十分なコンテキストの組み合わせにより、AI生成の応答が監査可能で追跡可能かつ根拠に基づいたものになることを保証し、機械学習コミュニティがこれらの機能を活用して次世代の信頼性の高いAIシステムを構築することを期待しています。