2026-06-30 14:47 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:47 UTC+8

AI新聞：今天沒什麼大事發生

今天AI領域相對平靜，但仍有重要進展：Meta的非侵入式腦機介面Brain2Qwerty v2、Cursor的iOS遠端代理釋出、DeepSeek的DSpark推測解碼技術、開放權重模型的商業化訪問，以及Snowflake的Arctic RL訓練基礎設施。Reddit社群討論了在兩臺Mac上本地執行GLM-5.2 753B的情況。

來源Latent Space

今日AI新聞相對平靜，但技術進展依然不少。Meta宣佈了Brain2Qwerty v2，一種非侵入式腦機介面系統，能夠從腦電訊號中即時解碼句子，單詞準確率達到約61%，最佳參與者達到78%。該系統結合了神經訊號建模和語言模型，使實驗室條件下的句子級解碼成為可能。Meta同時釋出了訓練程式碼和資料集，為後續研究提供了基礎。

Cursor在移動端邁出重要一步，推出了iOS應用，支援始終線上的雲代理和遠端控制電腦上的代理。使用者可以透過手機啟動代理、檢視差異和接收通知。這一發布標誌著代理系統正從桌面走向移動端。

在推理系統方面，DeepSeek的DSpark成為焦點。DSpark是一種推測解碼技術，透過更優的草稿生成和智慧驗證排程，在Qwen3-4B上比Eagle3提高了30.9%的接受長度，比DFlash提高16.3%。該技術已部署到DeepSeek-V4-Flash和V4-Pro的預覽引擎中，vLLM社群正在整合。同時，關於推理瓶頸的討論強調了預填充與解碼的區別、每次token延遲以及KV快取最佳化的重要性。

代理系統的演進方向從“選擇最佳模型”轉向“工程化編排”。Cognition釋出了Devin Fusion，一種混合模型編碼框架，聲稱在保持“Fable級”質量的同時成本降低35%。LangChain和LlamaIndex展示了動態子代理和檢索編排的新方法，代理系統正逐漸從簡單的工具呼叫轉變為可程式設計的控制平面。

開放權重模型的商業化加速：Clinet推出了每月9.99美元的通行證，提供GLM 5.2、DeepSeek、Kimi等打折訪問。GLM 5.2成為許多構建者的預設選擇，並在多種配置中測試。中國開源模型競爭加劇，美團即將釋出的LongCat 2.0/Owl Alpha模型擁有1.6T引數、1M上下文，訓練在5萬張國產加速器上進行，可能成為首個在國產硬體上訓練的接近前沿水平的模型。

訓練基礎設施方面，Snowflake開源了Arctic RL專案，整合ZoRRo加速器，實現最高6倍actor更新加速和3.5倍端到端加速，將Text2SQL訓練時間從5天縮短至約36小時。該模型在Snowflake的企業SQL基準測試中擊敗了Gemini 3.1 Pro和Claude 4.7的配置。

平臺更新方面，Cursor的移動遠端代理、Claude在Azure Foundry上的GA、以及Rampart的瀏覽器端隱私工具（用於在客戶端刪除PII）也值得關注。Reddit上，使用者展示了在兩臺M5 Max Mac上透過Thunderbolt 5本地執行GLM-5.2 753B（IQ1_S量化），達到約16 tok/s的速度，成為社群討論的熱點。