AI News HubLIVE
站内改写3 分で読了

LLMを超えて:スケーラブルなエンタープライズAI導入がエージェントロジックに依存する理由

本稿では、ナレッジグラフやプログラム解析ライブラリなどのエージェントロジックが、スケーラブルなエンタープライズAI導入を可能にする重要な役割を探ります。IBMの4つの領域(レガシーコード理解、テスト生成、インシデント対応、コンプライアンス近代化)での実践を通じて、エージェントロジックがLLMコンテキストを削減し、コストを低減し、パフォーマンスを向上させる方法を示します。

AIエージェントの急速な発展において、大規模言語モデル(LLM)は強力な能力を示していますが、LLMだけに依存してもエンタープライズAIのスケーラブルな導入は実現できません。本稿では、その鍵は「エージェントロジック」にあると指摘します。エージェントロジックとは、ナレッジグラフ、プログラム解析ライブラリ、アルゴリズムなどのソフトウェアプリミティブから構成される誘導メカニズムであり、エージェント層で能動的にLLMをエンタープライズワークフローのコアに向けさせ、コンテキスト空間を大幅に縮小し、パフォーマンスを向上させるとともにコストを削減します。

IBMは複数の製品でこの概念を検証しました。まず、レガシーコード理解において、IBM watsonx Code Assistant for Z(WCA4Z)のApp Insightsエージェントは、深層静的解析を活用し、事前インデックス化されたデータベーススキーマにアプリケーション情報を格納することで、構造化データを正確に取得します。複数のミッションクリティカルなレガシーシステム(最大100万行のコード、1000プログラム)のテストでは、最先端のLLMのみのアプローチと比較して、わずかに優れたアプリケーション理解性能を維持しながら、トークン消費を約30倍削減しました。

次に、テスト生成分野では、IBMのAsterライブラリがプログラム解析を通じてユニット、統合、API、変更ベースのテストをエージェントで生成します。75以上のJava CIOアプリケーション(最大560クラス、6万7000行のコード)において、AsterとDevstral 24Bモデルの組み合わせにより、ライン、ブランチ、メソッドのカバレッジで20%から45%の改善、トークン消費で最大15倍の削減を達成しました。これは、プログラム解析の出力がLLMを「焦点化」し、サブエージェントがカバレッジを強化しランタイムエラーを修正することで、より高性能でコスト効率の高い結果をもたらすためです。

第三に、インシデント対応とシフトレフトアプリケーション復元力において、IBMはナレッジグラフ(マイクロサービス、データベース、MELTなどのエンティティを含む)とドメイン専門家の暗黙知を組み合わせ、オブザーバビリティ駆動のオーケストレーションを採用しました。Instanaの「I3」エージェントは、ITBenchベンチマークでGPT-5.1ベースのReActエージェントと比較して最大4.0倍のパフォーマンス向上を示し、Gemini 3 Flashを使用した場合でも、I3エージェントは1.6倍少ないトークンでわずかに優れた性能を発揮しました。さらに、ソースコード分析に拡張し、Gemini 2.5 Flashを組み合わせたエージェントは、原因マイクロサービスの特定で3.0倍、バグ修復で1.6倍の性能向上を達成し、トークン消費はそれぞれ3.7倍、5.9倍削減しました。このマルチエージェントシステムは、IBM Thinkで発表されたIBM Concertプラットフォームの一部として提供されています。

最後に、コンプライアンス近代化において、IBMのマルチエージェントシステムはアルゴリズムによって複雑なタスクを調整されたステップに分解し、適応的計画と動的分解を用います。ITBenchでは、固定計画戦略を使用するClaude 4 Sonnetエージェントと比較して1.3~2.0倍の性能向上を示し、特に複雑なシナリオでは成功率が一桁から80%以上に向上しました。このシステムはIBM Sovereign Coreの一部として発表されました。

さらに、2つのドメインケーススタディが紹介されています。ケーススタディ1:医療分野での設定可能な汎用エージェント(CUGA)は、ポリシー・アズ・コードによるエージェントガバナンスを実装し、Claude Opus、GPT OSS 120B、GPT-4.1などのモデルファミリーでタスク正確性を15%から26%向上させました。ケーススタディ2:Maximo Condition Insightsエージェントは、物理資産の状態ベースメンテナンスのために有向非巡回グラフ(DAG)を使用します。IBM Global Real Estate(GRE)での内部パイロットでは、資産分析時間が15~20分から15~30秒に短縮(97%改善)、資産レビューカバレッジが約1%から約30%に向上しました。AssetOpsBenchでは、根拠のない主張を57%削減、冗長性を35%低減、ルールコンプライアンスを30%改善、トークン使用量を平均77%削減しました。

これらの事例は、エージェントロジックがLLMコンテキストを削減し、ワークフローのコアを効率的にナビゲートすることで、高性能かつ低コストなエンタープライズAI導入を実現することを示しています。今後、この誘導メカニズムが成熟するにつれて、エンタープライズAIのスケーラブルな展開はより信頼性が高く効率的になるでしょう。