AI News HubLIVE
站內改寫2 分鐘閱讀

AI新聞:今天沒什麼大事發生

今天AI領域相對平靜,但仍有重要進展:Meta的非侵入式腦機接口Brain2Qwerty v2、Cursor的iOS遠程代理發佈、DeepSeek的DSpark推測解碼技術、開放權重模型的商業化訪問,以及Snowflake的Arctic RL訓練基礎設施。Reddit社區討論了在兩台Mac上本地運行GLM-5.2 753B的情況。

今日AI新聞相對平靜,但技術進展依然不少。Meta宣佈了Brain2Qwerty v2,一種非侵入式腦機接口系統,能夠從腦電信號中實時解碼句子,單詞準確率達到約61%,最佳參與者達到78%。該系統結合了神經信號建模和語言模型,使實驗室條件下的句子級解碼成為可能。Meta同時發佈了訓練代碼和數據集,為後續研究提供了基礎。

Cursor在移動端邁出重要一步,推出了iOS應用,支持始終在線的雲代理和遠程控制電腦上的代理。用户可以通過手機啓動代理、查看差異和接收通知。這一發布標誌着代理系統正從桌面走向移動端。

在推理系統方面,DeepSeek的DSpark成為焦點。DSpark是一種推測解碼技術,通過更優的草稿生成和智能驗證調度,在Qwen3-4B上比Eagle3提高了30.9%的接受長度,比DFlash提高16.3%。該技術已部署到DeepSeek-V4-Flash和V4-Pro的預覽引擎中,vLLM社區正在集成。同時,關於推理瓶頸的討論強調了預填充與解碼的區別、每次token延遲以及KV緩存優化的重要性。

代理系統的演進方向從“選擇最佳模型”轉向“工程化編排”。Cognition發佈了Devin Fusion,一種混合模型編碼框架,聲稱在保持“Fable級”質量的同時成本降低35%。LangChain和LlamaIndex展示了動態子代理和檢索編排的新方法,代理系統正逐漸從簡單的工具調用轉變為可編程的控制平面。

開放權重模型的商業化加速:Clinet推出了每月9.99美元的通行證,提供GLM 5.2、DeepSeek、Kimi等打折訪問。GLM 5.2成為許多構建者的默認選擇,並在多種配置中測試。中國開源模型競爭加劇,美團即將發佈的LongCat 2.0/Owl Alpha模型擁有1.6T參數、1M上下文,訓練在5萬張國產加速器上進行,可能成為首個在國產硬件上訓練的接近前沿水平的模型。

訓練基礎設施方面,Snowflake開源了Arctic RL項目,集成ZoRRo加速器,實現最高6倍actor更新加速和3.5倍端到端加速,將Text2SQL訓練時間從5天縮短至約36小時。該模型在Snowflake的企業SQL基準測試中擊敗了Gemini 3.1 Pro和Claude 4.7的配置。

平台更新方面,Cursor的移動遠程代理、Claude在Azure Foundry上的GA、以及Rampart的瀏覽器端隱私工具(用於在客户端刪除PII)也值得關注。Reddit上,用户展示了在兩台M5 Max Mac上通過Thunderbolt 5本地運行GLM-5.2 753B(IQ1_S量化),達到約16 tok/s的速度,成為社區討論的熱點。