2026-05-23 12:21 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

【AINews】所有模型實驗室現在都是智慧體實驗室

在OpenAI即將上市之際，行業巨頭紛紛從純模型轉向智慧體產品。DeepSeek永久降價75%，MCP協議簡化，谷歌推出全天候智慧體，Anthropic發現上萬高危漏洞。智慧體化成為AI新常態。

在OpenAI即將於下週提交IPO申請之際，該公司聯合創始人Greg Brockman發表了一系列評論，表明模型實驗室正越來越多地同時構建智慧體產品。這一立場與之前“大模型團隊”成員的普遍觀點形成鮮明對比，包括OpenAI實驗室前負責人。

與此同時，AI21工作室關閉了模型團隊，全面轉向智慧體開發；就連一向專注於模型的DeepSeek也首次組建了“Harness團隊”。這印證了“系統優於模型”的觀點，但有一個微妙之處：與智慧體協同訓練的模型可能會進一步限制模型訪問許可權——如果模型經過後期訓練後只能與封閉原始碼的智慧體有效配合，那麼大部分使用者將被引導至智慧體產品，削弱模型/API的競爭關係。

在產品層面，智慧體化趨勢明顯：OpenAI透過“Codex Thursday No.6”更新了Codex，新增應用截圖、目標改進、遠端計算機使用、註釋模式、外掛共享和分析功能。使用者表示編碼方式發生根本性改變，有人已一個月未開啟IDE。同時，Claude Devs將自動模式擴充套件至Pro計劃並支援Sonnet 4.6。

在模型效能與成本方面，DeepSeek的降價是最強的市場訊號。其V4 Pro模型永久降價75%，使推理成本降至約0.18美元/百萬token，比Gemini 3.1 Pro Preview低約3倍，比GPT-5.5低12倍，比Claude Opus 4.7低19倍。社群認為其正在推動“智慧體價格低到無法計量”的時代。

協議和基礎設施方面，MCP協議釋出2026-07-28候選版本，核心變化是無狀態化——無需握手和會話ID，任何請求可訪問任何伺服器例項。這使得擴充套件和負載均衡更加簡單。此外，沙盒和託管執行成為一級原語：CoreWeave推出公開預覽版Sandboxes，Cloudsail提供每任務沙盒，NVIDIA開源AI-Q智慧體技能等。

研究方面，RL後訓練和獎勵設計正在被重新審視：Vector Policy Optimization（VPO）透過最佳化向量獎勵而非標量獎勵來改善測試時擴充套件效能。智慧體編譯/蒸餾成為一個重要經濟概念——複雜智慧體工作流可被蒸餾成權重，以約100倍低的推理成本執行，同時保持接近前沿質量。

多模態系統方面，谷歌I/O大會推出了Gemini Spark全天候個人AI智慧體，以及Project Genie + Street View將真實地點轉化為可互動世界。Runway釋出Aleph 2.0，支援多鏡頭序列至30秒1080p。語音和影像生成也有顯著進步。

網路安全領域，Anthropic的Project Glasswing在一個月內發現超過一萬個高危或嚴重漏洞，並警告行業需適應新漏洞規模。Perplexity開源了Bumblebee掃描器。美國移民政策變化引發AI領袖強烈反對，認為將損害高技能人才管道和AI競爭力。