Microsoft Foundry:エンタープライズAIの戦いは能力ではなく信頼性とガバナンスにある
Microsoft Build 2026で、Microsoftはエンタープライズ向けAIエージェントの信頼性とガバナンスを高めるためにMicrosoft Foundryの一連のアップデートを発表しました。新機能には、ホステッドエージェントランタイム、ツールボックスによるツールガバナンス、ASSERTによるポリシーベースの評価、オープンなエージェント制御仕様(ACS)、複数のメモリタイプ、ナレッジ統合が含まれます。この動きは、Microsoftが生の能力ではなくプロダクショングレードのエージェントインフラストラクチャに注力していることを示しています。
AIエージェントの波は、印象的なデモを数多く生み出してきました。しかし、本番環境(実際の負荷、実際のデータ、実際のコンプライアンス要件)で耐えうるエージェントはほとんどありませんでした。最近のMicrosoft Build 2026カンファレンスで、Microsoftはこのギャップに直接対処し、Microsoft Foundryに対する一連のアップデートをリリースしました。これらは総合的に、開発者プレビューというよりもエンタープライズランタイムに近いものになっています。
Microsoftは、ホステッドエージェントインフラストラクチャ、評価ツール、オープンなガバナンス仕様、メモリ、ナレッジ検索、拡張されたモデルオプションにわたる幅広いアップデートを出荷しました。個々に見れば、それぞれ合理的な製品アップデートです。しかし、これらを総合すると、MicrosoftがエンタープライズAIの次の競争の最前線は能力ではなく、信頼性とガバナンスにあると判断したことがわかります。
「Build 2026で、Microsoft Foundryは、プロダクションエージェントのために開発者が必要とするプラットフォーム要素(ランタイム、ツール、メモリ、グラウンディング、モデル、可観測性、ガバナンス)をさらに追加しました」と、Microsoftの開発者エクスペリエンス担当シニアプログラムマネージャーであるNick Brady氏は、発表をまとめたブログ記事に書いています。
書き換え不要のランタイム
インフラストラクチャストーリーの中心は、Foundry Agent Serviceのホステッドエージェントです。Microsoftは2026年7月初旬までに一般提供(GA)に達する見込みです。このセットアップは、各セッションが専用のコンピューティング、メモリ、永続的なファイルシステムアクセスを持つ独自のサンドボックスで実行される管理ランタイムです。
注目に値するのは、そのフレームワーク中立性です。Microsoft Agent Framework、GitHub Copilot SDK、LangGraph、その他のSDKで構築されたエージェントは、書き換えなしでデプロイできます。2つのプロトコルがサポートされています:OpenAI互換のステートフルインタラクションのためのResponses APIと、開発者がリクエストとレスポンスの形式を自分で制御できるパススルーシナリオのためのinvocationsプロトコルです。2番目のオプションは、すでにカスタムオーケストレーションを構築していて、それを破棄するつもりのないチームにとって重要です。
ホステッドランタイムは、現在パブリックプレビュー中のルーチンもサポートしており、任意のエージェントをタイマーやスケジュールで実行できます(夜間の課題トリアージ、日次レポートなど)。長時間実行される自律エージェントは永続的な状態を取得します。
ランタイムと並んで、VS Code用Foundry Toolkitが一般提供されました。Brady氏はこれを、開発者が「テンプレートまたはGitHub Copilotを使用してエージェントを作成し、トレース可視化を使用してローカルでデバッグ実行し、ツールボックスに接続し、VS CodeからFoundry Agent Serviceにデプロイできる」ツールと説明しています。
ツールボックスとツールガバナンス問題
エージェントのツール数が増えるにつれて、ツールガバナンス自体がエンジニアリング問題になります。Foundryのツールボックス(現在パブリックプレビュー)は、すべてのツールタイプに対して単一の管理エンドポイントをエージェントに提供します。一度設定すれば、任意のMCPクライアントを単一のURLにポイントするだけで、Foundryが認証、ライフサイクル、ガバナンスを処理します。
プロジェクトスコープのカタログでバージョン管理され、MCPリソースとして検出可能なスキルは、現在ツールボックスモデルで第一級市民です。ツール検索機能(これもプレビュー)は、タスクごとに適切なツールを選択するのに役立ち、モデルにカタログ全体をダンプすることを防ぎます。これは品質とコンテキストウィンドウの肥大化防止の両方に重要です。
ツールボックスはまた、Microsoft IQ(Work IQ、Fabric IQ(Fabricデータエージェント含む)、Ontology、セマンティックモデルを含む)に接続するため、エージェントは各ソースにカスタムパイプラインを必要とせずにエンタープライズデータを利用できます。
ベンチマークだけでなくポリシーに基づく評価
2つのガバナンス発表が際立ちました。1つ目は、ASSERT(Adaptive Spec-driven Scoring for Evaluation and Regression Testing)です。Microsoft Researchの作業に基づく、ポリシー駆動型エージェント評価のためのMicrosoftの新しいオープンソースフレームワークです。ASSERTは、静的なベンチマークに対してエージェントを実行するのではなく、書かれたポリシーを具体的で測定可能な評価に変換し、ターゲットを絞ったシナリオを生成して、本番環境に到達する前に安全性と品質の欠陥を明らかにします。LangChain、CrewAI、LightLLM、OpenAIなどのフレームワークで動作します。
2つ目は、ACS(Agent Control Specification)です。エージェントのライフサイクルにおける5つのチェックポイント(入力、LLM、状態、ツール実行、出力)に決定的な安全性とセキュリティ制御を配置するためのオープンな業界仕様です。ACSはポータブルなYAML契約として表現され、バージョン管理可能、監査可能、フレームワーク非依存です。ローンチパートナーには、Infosys、KPMG、IBM、Aviatrix、BigSpin、CrewAIが含まれます。
この組み合わせは、実際の問題を指しています。本番環境でのエージェントの障害はランダムではなく、予測可能な入力タイプ、ツールの誤用パターン、出力のエッジケースに集中する傾向があります。ASSERTはそれらの障害モードをテスト可能にします。ACSは制御をフレームワーク間でポータブルにし、組織間で監査可能にします。
評価スタックの残り:Guided Guardrail Setup(Foundry Agent Builderのアンケートベースのウィザード。PIIフィルター、脱獄保護、タスク順守制御をセキュリティ専門知識なしで推奨)と、Rubric評価ツール(エージェントの定義とユースケースから重み付けされた品質基準を自動生成)です。
メモリとナレッジ
Foundry Agent Serviceのメモリ(パブリックプレビュー)は、現在3つのタイプをカバーしています。Buildで新たに追加された手続き型メモリは、エージェントが実行間で作業の実行方法を学習するのに役立ちます(セッションで言われたことだけでなく)。Brady氏は、初期のTau-bench結果を引用し、ベースラインコストに近い状態で成功率が7〜14%絶対的に向上したと述べています。これは独立した再現を保証するほど具体的です。ユーザーメモリは、セッション間で好みや事実を保持します。セッションメモリはスレッド内でコンテキストを維持します。
ナレッジ面では、Foundry IQがパブリックプレビューでサーバーレスオプションを取得し、Work IQ、Fabric IQ、File Search、Azure SQL、MCPにわたる新しいナレッジソース、およびSLA対応の検索を備えたナレッジベースが一般提供されました。Brady氏は、カスタムRAGパイプラインを「Foundryエージェントの背後にある専用ナレッジレイヤー」に置き換えると説明しました。Web IQは、ライブ外部コンテキストを必要とするエージェントのために、データ保持ゼロで200ミリ秒未満のWebグラウンディングを追加します。
モデルと計算
Microsoftは、4つのファーストパーティMAIモデルがパブリックプレビューに入ることを発表しました:チャットと推論用のMAI-Thinking-1、画像生成と編集用のMAI-Image-2.5、話者分離付き音声認識用のMAI-Transcribe-2、多言語テキスト読み上げと音声クローニング用のMAI-Voice-2です。
Fireworks AI on Foundryが一般提供に達し、エンタープライズSLA、SOC 2対応、PTUデータゾーンサポートを備えた単一のAzureエンドポイントを通じてオープンモデル推論を提供します。これにより、個別のインフラストラクチャや契約なしでエンタープライズアクセスが可能になります。
Microsoftはまた、Frontier Tuningが、技術的なMicrosoftドキュメントの作成などのタスクにおいて、GPT-5.5よりも10倍以上コスト効率が高いと主張しています。これはテスト可能なほど具体的であり、検証されるまでは懐疑的であるべきほど一般的です。
より大きな全体像
Brady氏の要約が明確にしているのは、Build 2026でのFoundryの発表は相互に適合するように設計されているということです。ホステッドランタイムはデプロイメントを処理します。ツールボックスはツールガバナンスを処理します。ASSERTとACSは評価と制御を処理します。メモリは状態を処理します。Foundry IQはグラウンディングを処理します。RubricとAgent ROIはエージェントのパフォーマンスをビジネス成果に結びつけます。RubricはMicrosoft Foundryの新しい評価ツールタイプ(現在パブリックプレビュー)で、エージェントの特定のコンテキストに基づいて評価基準を自動生成します。
Microsoftは、エンタープライズエージェントAIにはプラットフォームレベルのインフラストラクチャが必要であり、そのプラットフォームはFoundryであるべきだと主張しています。
その主張が成功するかどうかは、Buildで何が出荷されたかではなく、エンタープライズが実際にエージェントをデモからデプロイメントに移行しようとしたときに何を見つけるかにかかっています。
それが、Microsoftが埋めつつあると言うギャップです。