AI News HubLIVE
站內改寫2 分鐘閱讀

AI新聞:今天沒什麼大事發生

今天AI領域相對平靜,但仍有重要進展:Meta的非侵入式腦機介面Brain2Qwerty v2、Cursor的iOS遠端代理釋出、DeepSeek的DSpark推測解碼技術、開放權重模型的商業化訪問,以及Snowflake的Arctic RL訓練基礎設施。Reddit社群討論了在兩臺Mac上本地執行GLM-5.2 753B的情況。

今日AI新聞相對平靜,但技術進展依然不少。Meta宣佈了Brain2Qwerty v2,一種非侵入式腦機介面系統,能夠從腦電訊號中即時解碼句子,單詞準確率達到約61%,最佳參與者達到78%。該系統結合了神經訊號建模和語言模型,使實驗室條件下的句子級解碼成為可能。Meta同時釋出了訓練程式碼和資料集,為後續研究提供了基礎。

Cursor在移動端邁出重要一步,推出了iOS應用,支援始終線上的雲代理和遠端控制電腦上的代理。使用者可以透過手機啟動代理、檢視差異和接收通知。這一發布標誌著代理系統正從桌面走向移動端。

在推理系統方面,DeepSeek的DSpark成為焦點。DSpark是一種推測解碼技術,透過更優的草稿生成和智慧驗證排程,在Qwen3-4B上比Eagle3提高了30.9%的接受長度,比DFlash提高16.3%。該技術已部署到DeepSeek-V4-Flash和V4-Pro的預覽引擎中,vLLM社群正在整合。同時,關於推理瓶頸的討論強調了預填充與解碼的區別、每次token延遲以及KV快取最佳化的重要性。

代理系統的演進方向從“選擇最佳模型”轉向“工程化編排”。Cognition釋出了Devin Fusion,一種混合模型編碼框架,聲稱在保持“Fable級”質量的同時成本降低35%。LangChain和LlamaIndex展示了動態子代理和檢索編排的新方法,代理系統正逐漸從簡單的工具呼叫轉變為可程式設計的控制平面。

開放權重模型的商業化加速:Clinet推出了每月9.99美元的通行證,提供GLM 5.2、DeepSeek、Kimi等打折訪問。GLM 5.2成為許多構建者的預設選擇,並在多種配置中測試。中國開源模型競爭加劇,美團即將釋出的LongCat 2.0/Owl Alpha模型擁有1.6T引數、1M上下文,訓練在5萬張國產加速器上進行,可能成為首個在國產硬體上訓練的接近前沿水平的模型。

訓練基礎設施方面,Snowflake開源了Arctic RL專案,整合ZoRRo加速器,實現最高6倍actor更新加速和3.5倍端到端加速,將Text2SQL訓練時間從5天縮短至約36小時。該模型在Snowflake的企業SQL基準測試中擊敗了Gemini 3.1 Pro和Claude 4.7的配置。

平臺更新方面,Cursor的移動遠端代理、Claude在Azure Foundry上的GA、以及Rampart的瀏覽器端隱私工具(用於在客戶端刪除PII)也值得關注。Reddit上,使用者展示了在兩臺M5 Max Mac上透過Thunderbolt 5本地執行GLM-5.2 753B(IQ1_S量化),達到約16 tok/s的速度,成為社群討論的熱點。