2026-05-23 12:21 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

【AINews】所有模型實驗室現在都是智能體實驗室

在OpenAI即將上市之際，行業巨頭紛紛從純模型轉向智能體產品。DeepSeek永久降價75%，MCP協議簡化，谷歌推出全天候智能體，Anthropic發現上萬高危漏洞。智能體化成為AI新常態。

在OpenAI即將於下週提交IPO申請之際，該公司聯合創始人Greg Brockman發表了一系列評論，表明模型實驗室正越來越多地同時構建智能體產品。這一立場與之前“大模型團隊”成員的普遍觀點形成鮮明對比，包括OpenAI實驗室前負責人。

與此同時，AI21工作室關閉了模型團隊，全面轉向智能體開發；就連一向專注於模型的DeepSeek也首次組建了“Harness團隊”。這印證了“系統優於模型”的觀點，但有一個微妙之處：與智能體協同訓練的模型可能會進一步限制模型訪問權限——如果模型經過後期訓練後只能與封閉源代碼的智能體有效配合，那麼大部分用户將被引導至智能體產品，削弱模型/API的競爭關係。

在產品層面，智能體化趨勢明顯：OpenAI通過“Codex Thursday No.6”更新了Codex，新增應用截圖、目標改進、遠程計算機使用、註釋模式、插件共享和分析功能。用户表示編碼方式發生根本性改變，有人已一個月未打開IDE。同時，Claude Devs將自動模式擴展至Pro計劃並支持Sonnet 4.6。

在模型性能與成本方面，DeepSeek的降價是最強的市場信號。其V4 Pro模型永久降價75%，使推理成本降至約0.18美元/百萬token，比Gemini 3.1 Pro Preview低約3倍，比GPT-5.5低12倍，比Claude Opus 4.7低19倍。社區認為其正在推動“智能體價格低到無法計量”的時代。

協議和基礎設施方面，MCP協議發佈2026-07-28候選版本，核心變化是無狀態化——無需握手和會話ID，任何請求可訪問任何服務器實例。這使得擴展和負載均衡更加簡單。此外，沙盒和託管執行成為一級原語：CoreWeave推出公開預覽版Sandboxes，Cloudsail提供每任務沙盒，NVIDIA開源AI-Q智能體技能等。

研究方面，RL後訓練和獎勵設計正在被重新審視：Vector Policy Optimization（VPO）通過優化向量獎勵而非標量獎勵來改善測試時擴展性能。智能體編譯/蒸餾成為一個重要經濟概念——複雜智能體工作流可被蒸餾成權重，以約100倍低的推理成本運行，同時保持接近前沿質量。

多模態系統方面，谷歌I/O大會推出了Gemini Spark全天候個人AI智能體，以及Project Genie + Street View將真實地點轉化為可交互世界。Runway發佈Aleph 2.0，支持多鏡頭序列至30秒1080p。語音和圖像生成也有顯著進步。

網絡安全領域，Anthropic的Project Glasswing在一個月內發現超過一萬個高危或嚴重漏洞，並警告行業需適應新漏洞規模。Perplexity開源了Bumblebee掃描器。美國移民政策變化引發AI領袖強烈反對，認為將損害高技能人才管道和AI競爭力。