【AINews】すべてのモデルラボは今やエージェントラボ
OpenAIのIPO申請を前に、業界の巨人たちが純粋なモデルからエージェント製品へとシフトしている。DeepSeekが永久75%値下げ、MCPプロトコルがステートレス化、Googleが年中無休のAIエージェントを発表、Anthropicが1万以上の脆弱性を発見。エージェント化が新たな常識に。
記事インテリジェンス
要点
- Greg Brockman氏、モデル単体はもはや製品ではなく、ハーネス+エージェント+ワークフローが重要と発言
- DeepSeek V4 Proが永久75%値下げ、推論コストを大幅削減
- MCPプロトコルがステートレス版を導入、インフラを簡素化
- AnthropicのProject Glasswingが1ヶ月で1万以上の深刻な脆弱性を発見
- Googleが年中無休のパーソナルAIエージェント「Gemini Spark」を発表
重要な理由
このニュースが重要なのは、Greg Brockman氏、モデル単体はもはや製品ではなく、ハーネス+エージェント+ワークフローが重要と発言ためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
OpenAIが来週にもIPO申請を行うと見られる中、同社の共同創業者Greg Brockman氏は、モデルラボがますますエージェントを製品として構築していることを示す一連のコメントを発表した。この発言は、以前の大規模モデルチームのメンバーがほぼ一貫して保持していた立場からの大きな転換である。
同時に、AI21はモデルチームを解散し、エージェントに完全にピボットした。DeepSeekも初めて「ハーネスチーム」を立ち上げている。「システム対モデル」派はこれを長年の主張の検証と見るだろうが、モデルをハーネスと共に学習させることで、モデルへのアクセスをさらに制限する可能性がある。つまり、モデルを効果的にポストトレーニングしてクローズドソースのエージェントでのみ有意義に動作するようにすれば、モデル/APIの競合を犠牲にして大多数のユーザーをエージェントに誘導できる。
製品面では、OpenAIが「Codex Thursday No.6」でCodexを大幅に更新し、アプリショット、目標改善、ロック中のリモートコンピュータ使用、アノテーションモード、プラグイン共有、分析を追加した。ユーザーはワークフローが大きく変わったと報告しており、あるユーザーは1ヶ月以上IDEを開いていないと述べている。Claude Devsは自動モードをProプランに拡大し、Sonnet 4.6をサポートした。
モデルのパフォーマンスとコスト面では、DeepSeekの値下げが最大の市場シグナルだった。V4 Proの75%値下げを恒久化し、推論コストを約0.18ドル/百万トークンに引き下げた。これはGemini 3.1 Pro Previewの約3分の1、GPT-5.5の約12分の1、Claude Opus 4.7の約19分の1である。コミュニティは「知能が安すぎて計測できない」時代の到来を歓迎した。
プロトコルとインフラでは、MCPが2026-07-28リリース候補版を発表し、プロトコルをステートレス化した。これにより拡張性と負荷分散が容易になる。CoreWeaveはプレビュー版Sandboxesを公開し、NVIDIAはAI-Qエージェントスキルをオープンソース化した。
研究面では、ベクトル方策最適化(VPO)が報酬崩壊に対処する手法として登場した。エージェントコンパイル/蒸留も重要な経済概念として浮上し、複雑なエージェントワークフローを重みに蒸留して元の約100分の1の推論コストで実行できるようになった。
マルチモーダルシステムでは、Google I/Oで年中無休のパーソナルAIエージェント「Gemini Spark」や、現実の場所をインタラクティブな世界に変換するProject Genie + Street Viewが発表された。RunwayはAleph 2.0をリリースし、30秒1080pのマルチショットシーケンスをサポートした。
サイバーセキュリティでは、AnthropicのProject Glasswingが1ヶ月で1万以上の高重要度または深刻な脆弱性を発見し、業界に警鐘を鳴らした。PerplexityはオープンソースのスキャナーBumblebeeを公開。米国の移民政策変更はAIリーダーから強い反発を招き、高度人材パイプラインとAI競争力を損なうと批判された。