AI News HubLIVE
站内改写

【AINews】所有模型實驗室現在都是智能體實驗室

在OpenAI即將上市之際,行業巨頭紛紛從純模型轉向智能體產品。DeepSeek永久降價75%,MCP協議簡化,谷歌推出全天候智能體,Anthropic發現上萬高危漏洞。智能體化成為AI新常態。

文章情報

工程師進階

要點

  • Greg Brockman表示模型不再是產品,模型+智能體+工作流才是關鍵
  • DeepSeek V4 Pro永久降價75%,推理成本大幅降低
  • MCP協議推出無狀態版本,簡化基礎設施
  • Anthropic的Project Glasswing一個月內發現上萬高危漏洞
  • 谷歌推出Gemini Spark全天候個人AI智能體

為甚麼重要

這條新聞值得關注,因為Greg Brockman表示模型不再是產品,模型+智能體+工作流才是關鍵。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

在OpenAI即將於下週提交IPO申請之際,該公司聯合創始人Greg Brockman發表了一系列評論,表明模型實驗室正越來越多地同時構建智能體產品。這一立場與之前“大模型團隊”成員的普遍觀點形成鮮明對比,包括OpenAI實驗室前負責人。

與此同時,AI21工作室關閉了模型團隊,全面轉向智能體開發;就連一向專注於模型的DeepSeek也首次組建了“Harness團隊”。這印證了“系統優於模型”的觀點,但有一個微妙之處:與智能體協同訓練的模型可能會進一步限制模型訪問權限——如果模型經過後期訓練後只能與封閉源代碼的智能體有效配合,那麼大部分用户將被引導至智能體產品,削弱模型/API的競爭關係。

在產品層面,智能體化趨勢明顯:OpenAI通過“Codex Thursday No.6”更新了Codex,新增應用截圖、目標改進、遠程計算機使用、註釋模式、插件共享和分析功能。用户表示編碼方式發生根本性改變,有人已一個月未打開IDE。同時,Claude Devs將自動模式擴展至Pro計劃並支持Sonnet 4.6。

在模型性能與成本方面,DeepSeek的降價是最強的市場信號。其V4 Pro模型永久降價75%,使推理成本降至約0.18美元/百萬token,比Gemini 3.1 Pro Preview低約3倍,比GPT-5.5低12倍,比Claude Opus 4.7低19倍。社區認為其正在推動“智能體價格低到無法計量”的時代。

協議和基礎設施方面,MCP協議發佈2026-07-28候選版本,核心變化是無狀態化——無需握手和會話ID,任何請求可訪問任何服務器實例。這使得擴展和負載均衡更加簡單。此外,沙盒和託管執行成為一級原語:CoreWeave推出公開預覽版Sandboxes,Cloudsail提供每任務沙盒,NVIDIA開源AI-Q智能體技能等。

研究方面,RL後訓練和獎勵設計正在被重新審視:Vector Policy Optimization(VPO)通過優化向量獎勵而非標量獎勵來改善測試時擴展性能。智能體編譯/蒸餾成為一個重要經濟概念——複雜智能體工作流可被蒸餾成權重,以約100倍低的推理成本運行,同時保持接近前沿質量。

多模態系統方面,谷歌I/O大會推出了Gemini Spark全天候個人AI智能體,以及Project Genie + Street View將真實地點轉化為可交互世界。Runway發佈Aleph 2.0,支持多鏡頭序列至30秒1080p。語音和圖像生成也有顯著進步。

網絡安全領域,Anthropic的Project Glasswing在一個月內發現超過一萬個高危或嚴重漏洞,並警告行業需適應新漏洞規模。Perplexity開源了Bumblebee掃描器。美國移民政策變化引發AI領袖強烈反對,認為將損害高技能人才管道和AI競爭力。