2026-06-30 14:47 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:47 UTC+8

AI新闻：今天没什么大事发生

今天AI领域相对平静，但仍有重要进展：Meta的非侵入式脑机接口Brain2Qwerty v2、Cursor的iOS远程代理发布、DeepSeek的DSpark推测解码技术、开放权重模型的商业化访问，以及Snowflake的Arctic RL训练基础设施。Reddit社区讨论了在两台Mac上本地运行GLM-5.2 753B的情况。

来源Latent Space

今日AI新闻相对平静，但技术进展依然不少。Meta宣布了Brain2Qwerty v2，一种非侵入式脑机接口系统，能够从脑电信号中实时解码句子，单词准确率达到约61%，最佳参与者达到78%。该系统结合了神经信号建模和语言模型，使实验室条件下的句子级解码成为可能。Meta同时发布了训练代码和数据集，为后续研究提供了基础。

Cursor在移动端迈出重要一步，推出了iOS应用，支持始终在线的云代理和远程控制电脑上的代理。用户可以通过手机启动代理、查看差异和接收通知。这一发布标志着代理系统正从桌面走向移动端。

在推理系统方面，DeepSeek的DSpark成为焦点。DSpark是一种推测解码技术，通过更优的草稿生成和智能验证调度，在Qwen3-4B上比Eagle3提高了30.9%的接受长度，比DFlash提高16.3%。该技术已部署到DeepSeek-V4-Flash和V4-Pro的预览引擎中，vLLM社区正在集成。同时，关于推理瓶颈的讨论强调了预填充与解码的区别、每次token延迟以及KV缓存优化的重要性。

代理系统的演进方向从“选择最佳模型”转向“工程化编排”。Cognition发布了Devin Fusion，一种混合模型编码框架，声称在保持“Fable级”质量的同时成本降低35%。LangChain和LlamaIndex展示了动态子代理和检索编排的新方法，代理系统正逐渐从简单的工具调用转变为可编程的控制平面。

开放权重模型的商业化加速：Clinet推出了每月9.99美元的通行证，提供GLM 5.2、DeepSeek、Kimi等打折访问。GLM 5.2成为许多构建者的默认选择，并在多种配置中测试。中国开源模型竞争加剧，美团即将发布的LongCat 2.0/Owl Alpha模型拥有1.6T参数、1M上下文，训练在5万张国产加速器上进行，可能成为首个在国产硬件上训练的接近前沿水平的模型。

训练基础设施方面，Snowflake开源了Arctic RL项目，集成ZoRRo加速器，实现最高6倍actor更新加速和3.5倍端到端加速，将Text2SQL训练时间从5天缩短至约36小时。该模型在Snowflake的企业SQL基准测试中击败了Gemini 3.1 Pro和Claude 4.7的配置。

平台更新方面，Cursor的移动远程代理、Claude在Azure Foundry上的GA、以及Rampart的浏览器端隐私工具（用于在客户端删除PII）也值得关注。Reddit上，用户展示了在两台M5 Max Mac上通过Thunderbolt 5本地运行GLM-5.2 753B（IQ1_S量化），达到约16 tok/s的速度，成为社区讨论的热点。