2026-06-30 14:47 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:47 UTC+8

AI新聞：今天沒什麼大事發生

今天AI領域相對平靜，但仍有重要進展：Meta的非侵入式腦機接口Brain2Qwerty v2、Cursor的iOS遠程代理發佈、DeepSeek的DSpark推測解碼技術、開放權重模型的商業化訪問，以及Snowflake的Arctic RL訓練基礎設施。Reddit社區討論了在兩台Mac上本地運行GLM-5.2 753B的情況。

來源Latent Space

今日AI新聞相對平靜，但技術進展依然不少。Meta宣佈了Brain2Qwerty v2，一種非侵入式腦機接口系統，能夠從腦電信號中實時解碼句子，單詞準確率達到約61%，最佳參與者達到78%。該系統結合了神經信號建模和語言模型，使實驗室條件下的句子級解碼成為可能。Meta同時發佈了訓練代碼和數據集，為後續研究提供了基礎。

Cursor在移動端邁出重要一步，推出了iOS應用，支持始終在線的雲代理和遠程控制電腦上的代理。用户可以通過手機啓動代理、查看差異和接收通知。這一發布標誌着代理系統正從桌面走向移動端。

在推理系統方面，DeepSeek的DSpark成為焦點。DSpark是一種推測解碼技術，通過更優的草稿生成和智能驗證調度，在Qwen3-4B上比Eagle3提高了30.9%的接受長度，比DFlash提高16.3%。該技術已部署到DeepSeek-V4-Flash和V4-Pro的預覽引擎中，vLLM社區正在集成。同時，關於推理瓶頸的討論強調了預填充與解碼的區別、每次token延遲以及KV緩存優化的重要性。

代理系統的演進方向從“選擇最佳模型”轉向“工程化編排”。Cognition發佈了Devin Fusion，一種混合模型編碼框架，聲稱在保持“Fable級”質量的同時成本降低35%。LangChain和LlamaIndex展示了動態子代理和檢索編排的新方法，代理系統正逐漸從簡單的工具調用轉變為可編程的控制平面。

開放權重模型的商業化加速：Clinet推出了每月9.99美元的通行證，提供GLM 5.2、DeepSeek、Kimi等打折訪問。GLM 5.2成為許多構建者的默認選擇，並在多種配置中測試。中國開源模型競爭加劇，美團即將發佈的LongCat 2.0/Owl Alpha模型擁有1.6T參數、1M上下文，訓練在5萬張國產加速器上進行，可能成為首個在國產硬件上訓練的接近前沿水平的模型。

訓練基礎設施方面，Snowflake開源了Arctic RL項目，集成ZoRRo加速器，實現最高6倍actor更新加速和3.5倍端到端加速，將Text2SQL訓練時間從5天縮短至約36小時。該模型在Snowflake的企業SQL基準測試中擊敗了Gemini 3.1 Pro和Claude 4.7的配置。

平台更新方面，Cursor的移動遠程代理、Claude在Azure Foundry上的GA、以及Rampart的瀏覽器端隱私工具（用於在客户端刪除PII）也值得關注。Reddit上，用户展示了在兩台M5 Max Mac上通過Thunderbolt 5本地運行GLM-5.2 753B（IQ1_S量化），達到約16 tok/s的速度，成為社區討論的熱點。