AI駆動の説明と実験による脳の理解
マイクロソフトリサーチと共同研究者らは、ブラックボックスモデルを検証可能な仮説に変換し、脳の特定領域が言語内の概念にどう反応するかを明らかにする生成的因果テスト(GCT)を導入した。
- GCTは脳予測モデルを短い言語説明に蒸留する。
- 新しいストーリーを生成しfMRIで説明を因果的に検証する。
ソース詳細
AI News Hub は Microsoft Research Blog の AI 更新を追跡し、ソース状態、利用範囲、収集方法、公開記事を表示します。
Official research source; confirm reuse terms before enabling full body display.
マイクロソフトリサーチと共同研究者らは、ブラックボックスモデルを検証可能な仮説に変換し、脳の特定領域が言語内の概念にどう反応するかを明らかにする生成的因果テスト(GCT)を導入した。
Microsoftの自律型マルウェア分類エージェントProject Ireが、主要なEDRツールでは検出されなかったLOTUSLITE亜種をリバースエンジニアリングしました。シグネチャマッチングではなく行動分析により、Ireはサンプルの悪意を特定し、Acronisの公開分析と一致する詳細な機能レポートを生成しました。
Data Formulator 0.7は、データ接続、エージェントガイドによる探索、ビジュアライゼーションの改善を共有ワークスペースで統合した、エンタープライズデータ分析向けのオープンソースAIシステムです。
現代のAIシステムは人間の知能を複製するのではなく、人間の認知と言語にすでに存在する構造を拡張するものです。この視点はAIの能力と限界を説明し、AI安全性を「暴走AI」の恐怖ではなく、工学とガバナンスを重視したシステムレベルの課題として再定義します。
マイクロソフトリサーチが、小規模モデル向けに設計されたエージェント型アプリケーションMagenticLite、オーケストレーションモデルMagenticBrain、ブラウザ操作モデルFara1.5を公開。これらはブラウザとローカルファイルシステムを横断して動作し、Webナビゲーションタスクで最先端の成果を達成。
Vegaは、マイクロソフトリサーチが開発したゼロ知識証明システムで、ユーザーが政府発行の証明書を開示せずに事実を証明できるようにします。一般的なデバイスで92ミリ秒未満の証明生成を実現し、フォールディング技術により効率的な再提示が可能で、モバイル運転免許証やEUデジタルアイデンティティウォレットなど現実のフォーマットに対応し、間もなくオープンソース化されます。
Microsoft Researchは、論文「LLMs Corrupt Your Documents When You Delegate」の意図を明確にし、長期委任タスクにおける情報忠実度の低下を診断するベンチマークであり、AIの実用価値を否定するものではないと述べている。
mimalloc は、Microsoft Research が開発したオープンソースの最新スケーラブルメモリアロケータで、malloc/free のドロップイン代替品です。コードは約12,000行とコンパクトで、内部データ構造が明確で、他のプロジェクトに容易に統合できます。原子操作にほぼ依存することで、境界のある最悪ケースの割り当て時間、低い空間オーバーヘッド、低い内部断片化、最小限の競合を実現します。Bing、NoGIL CPython、Unreal Engine、Death Stranding などで広く使用されています。
マイクロソフトが軽量ファンデーションモデルGridSFMを発表。ミリ秒単位で交流最適潮流を予測し、効率向上とコスト削減を実現。
マイクロソフトリサーチが、プリンシパル・エージェント設定におけるAIエージェントの社会的推論能力を評価するベンチマーク「SocialReasoning-Bench」を発表。テストの結果、最先端モデルはタスクを完了するものの、多くの場合ユーザーにとって最適な結果を得られず、明示的な指示があっても改善されないことが判明。ベンチマークは成果最適性とデューデリジェンスの指標を用いて、エージェントがユーザーの最善の利益のために行動する能力を測定する。
Microsoft Researchは、公開データから導出された米国電力網の近似的な送電トポロジーのオープンデータセットをリリースしました。これにより、制限されたグリッドデータによる研究課題を解決し、交流最適潮流解析が可能になります。このパイプラインはOpenStreetMapと公開エネルギー数値データを利用して、地理的に基づいた求解可能なグリッドモデルを構築し、48州および東部相互接続にわたって実証されています。このデータセットは、混雑、送電拡張、需要立地の研究をサポートします。
MicrosoftはNSDI '26において、データセンター、広域ネットワーク、AIシステム、クラウドインフラを網羅する11本の論文を発表し、大規模ネットワークシステムの構築と運用における最先端のイノベーションを示しました。
マイクロソフトリサーチは、100以上のAIエージェントが稼働するプラットフォームをレッドチーミングし、エージェント間の相互作用でのみ現れるネットワークレベルのリスクを特定しました。自己伝搬ワーム、評判操作、コンセンサスの捏造、プロキシチェーンなどが含まれます。これらのリスクはエージェント単体でのテストでは再現できません。また、少数のエージェントが自律的にセキュリティ行動を発展させ、攻撃成功率を低下させることも観察されました。プラットフォーム、エージェント、モデルの各層での多層防御の必要性が示唆されています。
AutoAdaptは、Microsoft Researchが開発した、大規模言語モデル(LLM)のドメイン適応を自動化するエンドツーエンドのフレームワークです。構造化構成グラフ、エージェント型プランナー、予算対応最適化ループを用いて、数週間かかっていた手動の反復を再現可能なパイプラインに変換し、医療、法律、クラウド運用などの高リスク領域で高速かつ信頼性の高い適応を実現します。
マイクロソフトリサーチの2025年版「仕事の新しい未来」レポートは、生成AIが仕事を急速に変革しているが、その利益は不均等に分配されていると指摘する。AIは協働のあり方を変え、人間の専門知識がより重要になる。AIをパートナーとして扱う組織が最大の利益を得ている。報告書は、格差拡大を防ぐために包括的なAI導入を呼びかけている。
マイクロソフトのチーフサイエンティスト、Jaime Teevan氏と研究者のJenna Butler氏、Jake Hofman氏、Rebecca Janssen氏が「New Future of Work Report 2025」を解説し、理想的なAI駆動型の仕事の世界を探求します。さらに、AIは「ツール」か「協力者」か?そして、その答えが重要な理由について議論します。
ADeLeは、Microsoft Researchがプリンストン大学とバレンシア工科大学と共同開発した手法で、18のコア能力(推論、ドメイン知識など)に基づいてAIモデルとタスクをスコアリングし、未知のタスクに対するパフォーマンスを約88%の精度で予測します。モデルの強みと弱みを明らかにし、従来のベンチマークを超えた説明可能なAI評価を提供します。
AsgardBench は、具現化AIエージェントが視覚フィードバックに基づいて計画を調整できるかをテストする新しいベンチマークです。AI2-THORシミュレーション環境上に構築され、エージェントをキッチンなどのシーンに配置し、オブジェクトの状態(カップがきれいかどうかなど)を観察して動的にアクションシーケンスを変更することを要求します。テストの結果、視覚情報により成功率が大幅に向上しましたが、現在のモデルは細かな視覚的差異の識別、進捗追跡、計画のタイムリーな更新において依然として課題を抱えています。
Microsoft Researchは、視覚言語モデルがロボットタスクにおいて行動計画と空間定位を同時に行う能力を評価するベンチマーク「GroundedPlanBench」を発表した。彼らが開発したV2GPフレームワークは、ロボットのデモ動画をトレーニングデータに変換し、結合型アプローチが分離型よりも優れていることを示した。
マイクロソフトリサーチのポッドキャスト『The Shape of Things to Come』の第1回では、ホストのDoug Burgerが研究者のNicolò FusiとSubutai Ahmadを迎え、現在のAIシステムが本当に知能を持つのかを議論。TransformerベースのLLMと人間の脳の分散型連続学習アーキテクチャを比較し、効率、表現、感覚運動基盤の違いを探る。
マイクロソフトリサーチがAgentRxフレームワークをオープンソース化。AIエージェントの障害を自動診断し、制約合成とガード評価により最初の重大障害ステップを特定。ベースラインと比較して位置特定精度23.6%向上。115の手動注釈付き失敗軌道を含むベンチマークも公開。