AI News HubLIVE
站内改写2 分で読了

LLMを超えて:スケーラブルなエンタープライズAI採用はエージェントロジックに依存する理由

IBM Researchは「エージェントロジック」の概念を提唱。知識グラフやプログラム解析などのソフトウェアプリミティブがLLMをエンタープライズワークフローの核心に導き、トークン消費を大幅に削減し、パフォーマンスを向上させる。レガシーコード理解、テスト生成、インシデント対応、コンプライアンス自動化の4領域で検証され、アプリ理解で約30倍のトークン削減、テスト生成で20-45%のカバレッジ向上を達成。ヘルスケア向け設定可能な汎用エージェントやIBMグローバル不動産向け条件ベース保守の事例も紹介。

IBM Researchは最近の記事で、エンタープライズAIのスケーラブルな採用には、大規模言語モデル(LLM)自体の能力に加えて、エージェントロジック(Agent Logic)と呼ばれる誘導機構が不可欠であると論じています。この考え方は、IBMの複数の製品領域での実践に基づいており、LLMのコンテキスト空間を縮小することでパフォーマンスを大幅に向上させつつコストを削減できることを示しています。

エンタープライズワークフローは、動的で長期にわたり、多数のAPIやデータベースを伴い、ビジネスポリシーや規制の制約を受けることが多い。LLMにこれらの複雑なタスクを直接処理させると、幻覚の増加やトークン消費の急増を招きます。エージェントロジックは、知識グラフ、アルゴリズム、プログラム解析ライブラリなどのソフトウェアプリミティブとして定義され、エージェント層で動作し、LLMをエンタープライズワークフローの核心に意図的に誘導することでコンテキスト空間を低減します。

記事では4つの領域での具体的な成果が紹介されています:

  1. レガシーコード理解(IBM WCA4ZのApp Insightsエージェント):深い静的解析を利用してアプリケーション情報をデータベーススキーマに事前インデックス化し、エージェントが正確な構造化情報を取得できるようにする。100万行のコードを理解する際、純LLM方式と比較してトークン消費を約30倍削減し、性能はわずかに優れています。
  2. テスト生成(Asterライブラリ):プログラム解析とデータ前処理/後処理に基づき、単体テスト、統合テストなどを生成。IBM CIOの75以上のJavaアプリケーションでDevstral 24Bモデルを使用し、行、ブランチ、メソッドのカバレッジが20〜45%向上し、トークン消費は最大15倍削減されました。
  3. インシデント対応と左シフトアプリケーション耐障害性(Instana I3エージェントなど):マイクロサービス、データベースなどを含む知識グラフを構築し、ドメイン専門家の知識を組み込む。可観測性主導のアプローチにより、I3エージェントはITBenchベンチマークでReAct+GPT-5.1を4.0倍上回り、トークン消費も低減。マルチエージェントシステムはIBM Concertプラットフォームに統合されました。
  4. コンプライアンス自動化(IBM Sovereign Core):アルゴリズムと適応型計画を使用して複雑なコンプライアンスタスクを協調的なステップに分解。マルチエージェントシステムは固定計画戦略のエージェントより1.3〜2.0倍高性能で、複雑なシナリオで成功率を一桁から80%以上に向上。

さらに、2つのケーススタディも紹介されています:

  • 医療分野の設定可能な汎用エージェント(CUGA):ポリシーアズコードによるエージェントガバナンスを実装し、ランタイムでモデルプロンプトから独立して実行。実験では、タスク正確性を純LLMより15〜26%向上させ、安全な意図処理、信頼性の高いツール使用などを実現。
  • IBMグローバル不動産向け条件ベース保守エージェント:有向非巡回グラフ(DAG)を使用して構造的なエンジニアリングコンテキストを提供。資産分析時間を15〜20分から15〜30秒に短縮し、カバレッジを約1%から30%に拡大。トークン消費を平均77%削減。

IBM Researchは、エージェントロジックがエンタープライズAIのスケーラブルな採用の鍵であり、性能を犠牲にすることなくコストを大幅に削減し、エンドユーザーの信頼を構築できると結論付けています。今後、この誘導機構はAIをエンタープライズの中核業務にさらに深く統合する推進力となるでしょう。