AI News HubLIVE
站内改写2 分钟阅读

AI新闻:今天没什么大事发生

今天AI领域相对平静,但仍有重要进展:Meta的非侵入式脑机接口Brain2Qwerty v2、Cursor的iOS远程代理发布、DeepSeek的DSpark推测解码技术、开放权重模型的商业化访问,以及Snowflake的Arctic RL训练基础设施。Reddit社区讨论了在两台Mac上本地运行GLM-5.2 753B的情况。

今日AI新闻相对平静,但技术进展依然不少。Meta宣布了Brain2Qwerty v2,一种非侵入式脑机接口系统,能够从脑电信号中实时解码句子,单词准确率达到约61%,最佳参与者达到78%。该系统结合了神经信号建模和语言模型,使实验室条件下的句子级解码成为可能。Meta同时发布了训练代码和数据集,为后续研究提供了基础。

Cursor在移动端迈出重要一步,推出了iOS应用,支持始终在线的云代理和远程控制电脑上的代理。用户可以通过手机启动代理、查看差异和接收通知。这一发布标志着代理系统正从桌面走向移动端。

在推理系统方面,DeepSeek的DSpark成为焦点。DSpark是一种推测解码技术,通过更优的草稿生成和智能验证调度,在Qwen3-4B上比Eagle3提高了30.9%的接受长度,比DFlash提高16.3%。该技术已部署到DeepSeek-V4-Flash和V4-Pro的预览引擎中,vLLM社区正在集成。同时,关于推理瓶颈的讨论强调了预填充与解码的区别、每次token延迟以及KV缓存优化的重要性。

代理系统的演进方向从“选择最佳模型”转向“工程化编排”。Cognition发布了Devin Fusion,一种混合模型编码框架,声称在保持“Fable级”质量的同时成本降低35%。LangChain和LlamaIndex展示了动态子代理和检索编排的新方法,代理系统正逐渐从简单的工具调用转变为可编程的控制平面。

开放权重模型的商业化加速:Clinet推出了每月9.99美元的通行证,提供GLM 5.2、DeepSeek、Kimi等打折访问。GLM 5.2成为许多构建者的默认选择,并在多种配置中测试。中国开源模型竞争加剧,美团即将发布的LongCat 2.0/Owl Alpha模型拥有1.6T参数、1M上下文,训练在5万张国产加速器上进行,可能成为首个在国产硬件上训练的接近前沿水平的模型。

训练基础设施方面,Snowflake开源了Arctic RL项目,集成ZoRRo加速器,实现最高6倍actor更新加速和3.5倍端到端加速,将Text2SQL训练时间从5天缩短至约36小时。该模型在Snowflake的企业SQL基准测试中击败了Gemini 3.1 Pro和Claude 4.7的配置。

平台更新方面,Cursor的移动远程代理、Claude在Azure Foundry上的GA、以及Rampart的浏览器端隐私工具(用于在客户端删除PII)也值得关注。Reddit上,用户展示了在两台M5 Max Mac上通过Thunderbolt 5本地运行GLM-5.2 753B(IQ1_S量化),达到约16 tok/s的速度,成为社区讨论的热点。