AI News HubLIVE
サイト内リライト4 分で読了

[AINews] メタハーネスの夏到来

AI分野の最新動向を総括。メタハーネスアーキテクチャの台頭、OpenAIのカスタム推論チップJalapeño、エージェントUXのツールから同僚へのシフト、Qwen-AgentWorldのオープンワールドモデル、GLM-5.2などの中国製オープンモデルの進展、そして政策・人材競争に関する話題をカバー。

ソースLatent Space

人工知能分野の急速な発展に伴い、「メタハーネス」(Meta-Harness)と呼ばれる新たな概念が台頭している。メタハーネスとは、多様なAIエージェントを統合・オーケストレーションするための統一プラットフォームを指す。その歴史は短いが変遷に富み、ConductorやZedのACPから始まり、OpenInspect、CloudflareのFlue、そしてVercelのEve、HarnessAgent、Heypiへと続き、現在はOmnigentが注目を集めている。OmnigentはDatabricksの共同創業者Matei Zahariaが推進するオープンソースプロジェクトで、あらゆるコーディングや知識作業エージェントを標準化された安全かつ信頼性の高いスケーラブルなシステムに組み込むためのプラグイン可能なアーキテクチャを提供する。MCPの成功要因を備えているかは不明だが、アーキテクチャレベルでは類似のオープンソースが最終的に勝利する可能性が高いと業界では見られている。

ハードウェア面では、OpenAIがBroadcomと協力して開発した初のカスタムAI推論チップJalapeñoを発表した。ChatGPT、Codex、APIトラフィック、将来のエージェント製品向けに設計されており、戦略的意図は明らかだ:チップ、カーネル、メモリ、ネットワーキング、スケジューリング、デプロイメントに至るスタックのより多くの部分を自社で掌握し、商用GPU供給への依存を減らすことである。設計からテープアウトまでわずか9ヶ月という異例の速さは、OpenAI自身のモデルによって加速されたとされる。コミュニティによるリバースエンジニアリングでは、JalapeñoはTPUライクなアーキテクチャで、約216GB HBM3Eメモリ、7.1~7.4 TB/s帯域幅、約10 PFLOPS FP4の性能を持つと推定されている。同日、QualcommがModularを買収し、ModularはMojoのオープンソース化計画が順調であると発表。これにより、NVIDIA/CUDA以外の垂直統合型推論スタックの競争が激化することが予想される。また、NVIDIAのNeMo AutoModelはエキスパート並列処理によりMoEモデルのトレーニングスループットを3.4~3.7倍向上させ、SkyPilotは統一推論エンドポイントを、Modalはオープンソース推論設定の低レイテンシを主張している。

エージェントのユーザーエクスペリエンス(UX)は「ツール」から「同僚」へと移行している。AnthropicがClaudeをSlackワークフローに組み込んだ事例が大きな注目を集めた。@karpathyはこれを単なる機能やSlackボットではなく、組織レベルのハーネスだと評した。@gallabytesはClaude Codeの「ペアリングパートナー」からTagsの「チーム管理」への体験的飛躍を指摘。しかし、このモデルはセキュリティとコストに関する懸念も引き起こしている。AnthropicのエージェントIDモデルはClaudeに独自の認証情報を付与し、すべてのアクションを監査可能にし、集中管理でアクセスを無効化できる。@KentonVardaは明示的な権限割り当てはスケールしないと批判し、ケイパビリティベースのセキュリティを提唱。@random_walkerは、深く埋め込まれたエージェントが暗黙知のロックイン、プロンプトインジェクションリスク、予算の不透明性をもたらすと警告した。これに対し、Hugging Faceは内部のSlackベースのコーディングエージェントMoon Botを公開し、セルフホスティング、カスタムツール、監査可能なセッション、ゼロロックインを強調。チームはエージェントネイティブなUXを望みつつも、ベンダーに組織知能を委託するよりも、ハーネスとメモリ層を自社で保持する傾向が強まっている。

モデルとメモリの面では、AlibabaのQwen-AgentWorldが「言語世界モデル」を提案。単一モデルでMCP、検索、ターミナル、SWE、Web、OS、Androidの7つの環境をシミュレートする。35B MoE(3Bアクティブ)、256Kコンテキストのモデルをオープンソース化し、AgentWorldBenchも公開。単一ステップの環境予測がマルチステップのエージェントタスクに転移し、ドメイン内外で性能向上を示した。一方、OpenThoughts-Agentは100以上の制御アブレーションを伴うオープンなエージェントモデルトレーニングパイプラインを提供。10万サンプルのトレーニングセットでQwen3-32Bをファインチューニングし、7つのエージェントベンチマークで平均44.8%の精度を達成。メモリはエージェントの未解決問題として注目され、WeaviateのEngramはメモリを非同期インフラとして位置づけ、@hwchase17はLangSmith/Context Hubによる「スリープタイム計算」ワークフローを示した。メモリはエージェントの差別化要因として重要視されつつある。

中国のオープンモデルも差を縮めている。GLM-5.2は現在最も強力なオープンウェイトモデルの一つとされ、Artificial AnalysisやAgent Arenaでトップにランクイン。CoreWeave、Baseten、Cursorなどで迅速なデプロイが進む。@nutlopeはGLM 5.2とOpus 4.8をウェブタスクで比較し、品質は同等で出力速度は約2倍、コストは約3分の1と報告。ARC-AGI-2では、GLM-5.2がオープンソースモデルとして最高の22.8%を記録。また、MoonshotのKimi APIがAWS Marketplaceに登場し、企業調達を容易にした。国内コンピュートでは、Huaweiが950 SuperPOD規模のシステムをデモする可能性が報じられ、国内NPUクラスターの大規模生産が中国のモデルサービングエコシステムの経済性と回復力を改善すると期待される。

政策と人材の動きも競争環境を再形成している。Anthropicはトランプ政権時代のAI輸出規制に対する最初の法的挑戦に直面。Legion社はホステッドモデルアクセスはウェイトや技術データの輸出に等しくないと主張。一方、AnthropicはAlibaba関連の事業者が約2万5000の不正アカウントと2880万回のClaude交換を通じてフロンティア能力をQwen級システムに蒸留したと非難。人材面では、Arthur ConmyがAnthropicに加わり、Mirendil AIが2億ドルのシードラウンドを調達、英国のBOLD LabとSOFAIRが6000万ポンドの資金を得た。Google DeepMindからAnthropicへの流出は、スタートアップが依然としてフロンティア人材を引き付けていることを示している。

以上のように、AI分野はメタハーネスアーキテクチャ、カスタムハードウェア、エージェントコラボレーションモデル、オープンソースモデル、政策・規制の多重的な変革を経験している。各プレイヤーは複雑化するエコシステム内で有利な位置を確保しようと奮闘しており、メタハーネスは統合とオーケストレーションの鍵として、次なる競争の焦点となるだろう。