【AINews】所有模型實驗室現在都是智慧體實驗室
在OpenAI即將上市之際,行業巨頭紛紛從純模型轉向智慧體產品。DeepSeek永久降價75%,MCP協議簡化,谷歌推出全天候智慧體,Anthropic發現上萬高危漏洞。智慧體化成為AI新常態。
文章情報
要點
- Greg Brockman表示模型不再是產品,模型+智慧體+工作流才是關鍵
- DeepSeek V4 Pro永久降價75%,推理成本大幅降低
- MCP協議推出無狀態版本,簡化基礎設施
- Anthropic的Project Glasswing一個月內發現上萬高危漏洞
- 谷歌推出Gemini Spark全天候個人AI智慧體
為什麼重要
這條新聞值得關注,因為Greg Brockman表示模型不再是產品,模型+智慧體+工作流才是關鍵。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
在OpenAI即將於下週提交IPO申請之際,該公司聯合創始人Greg Brockman發表了一系列評論,表明模型實驗室正越來越多地同時構建智慧體產品。這一立場與之前“大模型團隊”成員的普遍觀點形成鮮明對比,包括OpenAI實驗室前負責人。
與此同時,AI21工作室關閉了模型團隊,全面轉向智慧體開發;就連一向專注於模型的DeepSeek也首次組建了“Harness團隊”。這印證了“系統優於模型”的觀點,但有一個微妙之處:與智慧體協同訓練的模型可能會進一步限制模型訪問許可權——如果模型經過後期訓練後只能與封閉原始碼的智慧體有效配合,那麼大部分使用者將被引導至智慧體產品,削弱模型/API的競爭關係。
在產品層面,智慧體化趨勢明顯:OpenAI透過“Codex Thursday No.6”更新了Codex,新增應用截圖、目標改進、遠端計算機使用、註釋模式、外掛共享和分析功能。使用者表示編碼方式發生根本性改變,有人已一個月未開啟IDE。同時,Claude Devs將自動模式擴充套件至Pro計劃並支援Sonnet 4.6。
在模型效能與成本方面,DeepSeek的降價是最強的市場訊號。其V4 Pro模型永久降價75%,使推理成本降至約0.18美元/百萬token,比Gemini 3.1 Pro Preview低約3倍,比GPT-5.5低12倍,比Claude Opus 4.7低19倍。社群認為其正在推動“智慧體價格低到無法計量”的時代。
協議和基礎設施方面,MCP協議釋出2026-07-28候選版本,核心變化是無狀態化——無需握手和會話ID,任何請求可訪問任何伺服器例項。這使得擴充套件和負載均衡更加簡單。此外,沙盒和託管執行成為一級原語:CoreWeave推出公開預覽版Sandboxes,Cloudsail提供每任務沙盒,NVIDIA開源AI-Q智慧體技能等。
研究方面,RL後訓練和獎勵設計正在被重新審視:Vector Policy Optimization(VPO)透過最佳化向量獎勵而非標量獎勵來改善測試時擴充套件效能。智慧體編譯/蒸餾成為一個重要經濟概念——複雜智慧體工作流可被蒸餾成權重,以約100倍低的推理成本執行,同時保持接近前沿質量。
多模態系統方面,谷歌I/O大會推出了Gemini Spark全天候個人AI智慧體,以及Project Genie + Street View將真實地點轉化為可互動世界。Runway釋出Aleph 2.0,支援多鏡頭序列至30秒1080p。語音和影像生成也有顯著進步。
網路安全領域,Anthropic的Project Glasswing在一個月內發現超過一萬個高危或嚴重漏洞,並警告行業需適應新漏洞規模。Perplexity開源了Bumblebee掃描器。美國移民政策變化引發AI領袖強烈反對,認為將損害高技能人才管道和AI競爭力。