自驱动实验室:选择下一个实验的实验室 2026-06-26 18:58 UTC+8 自驱动实验室通过将AI与自动化实验硬件结合,使系统能够根据实验结果自主决定下一步实验,区别于仅执行预设脚本的自动化。
自驱动实验室的核心是AI与自动化硬件的结合,实现实验决策的自主化。 与自动化不同,自驱动实验室会通过实验实时学习并调整实验方向。 AI周报#883:Qwen进军机器人领域 2026-06-25 19:01 UTC+8 阿里巴巴的Qwen模型家族推出机器人套件,旨在弥合感知与行动之间的鸿沟。三个新模型分别专注于导航、操作和世界建模,核心挑战在于将物理动作转化为可学习的token。
Qwen模型长期局限于软件环境,无法执行物理操作。 阿里巴巴发布Qwen-Robot Suite,包含三个专用模型。 序列知识#882:关于蒸馏技术的新系列 2026-06-24 18:35 UTC+8 深入探讨现代AI中最重要的技术之一——蒸馏,以及它如何解决大规模模型带来的成本、部署和专业化问题。
蒸馏技术使AI模型更高效、更易部署,是应对规模带来的挑战的关键。 规模推动了AI进步,但也导致模型昂贵、缓慢、难以专业化。 The Sequence Special #881:人工智能模型的足球世界杯 2026-06-22 19:34 UTC+8 LayerLens 推出 Stratix 杯,这是一场顶级 AI 模型在模拟环境中作为智能体进行足球比赛,考验规划、适应和多智能体协调能力。
LayerLens 推出 Stratix 杯,这是一个 AI 模型的足球锦标赛。 比赛测试智能体能力:赛前策略、实时比赛和半场调整。 序列雷达 #880:上周AI要闻——600亿美元Cursor交易、谷歌人才流失、Midjourney的人体扫描仪 2026-06-21 19:02 UTC+8 AI市场上一周出现了一系列意想不到的转折:SpaceX以600亿美元收购Cursor,Noam Shazeer和John Jumper分别离开谷歌加入OpenAI和Anthropic,Midjourney推出全身医用扫描仪。
1. SpaceX以600亿美元股票收购Cursor,标志着AI工具已成为与火箭发射能力同等重要的战略基础设施。 2. Noam Shazeer和John Jumper相继离开谷歌,凸显了AI前沿领域激烈的人才争夺战,顶尖研究者成为最稀缺的资源。 序列AI本周第878期:谷歌DeepMind首次真正突破下一代令牌生成 2026-06-17 18:56 UTC+8 谷歌DeepMind发布了DiffusionGemma,这是一种文本扩散模型,挑战了传统的Transformer架构。该模型不依赖从左到右逐令牌生成文本的方式,而是采用全新的生成机制。
DiffusionGemma是谷歌DeepMind发布的一种文本扩散模型。 该模型挑战了传统的Transformer架构。 序列知识 #878:超越Transformer:我们学到的 2026-06-16 19:03 UTC+8 本文总结了关于Transformer替代方案的系列文章,涵盖四大类模型:递归/线性递归模型、状态空间模型、文本扩散模型和液态/连续时间模型。同时宣布将推出关于知识蒸馏的新系列。
自注意力机制带来二次方复杂度,长序列计算和内存成本高昂。 四种替代方向:递归模型(恒内存)、状态空间模型(线性缩放)、文本扩散(并行生成)、液态模型(连续时间动态)。 《序列雷达》第877期:上周AI大事记——Anthropic发布模型,苹果借用技术,马斯克上市,贝佐斯建厂 2026-06-14 19:03 UTC+8 上周AI领域发生四大重磅事件:Anthropic推出Claude Fable 5和Mythos 5,苹果发布Siri AI,SpaceX以史上最大IPO上市,贝佐斯的Prometheus融资120亿美元。这些事件标志着AI正从聊天窗口走向更广泛的物理世界。
Anthropic发布Claude Fable 5与Mythos 5,能力与访问权限分离 苹果推出Siri AI,搭载1.2万亿参数Gemini模型,利用个人上下文优势 序列观点:记录系统与行动系统 2026-06-11 19:03 UTC+8 讨论代理型AI时代企业软件的新范式:从记录系统转向行动系统。
传统企业软件以人为核心,记录状态。 代理型AI将改变软件的作用,重点转向可靠地执行行动。 本周AI序列 #875:为什么你的语言模型需要小憩 2026-06-10 18:39 UTC+8 论文《语言模型需要睡眠》提出,大语言模型存在“顺行性遗忘症”,无法在训练后学习新知识,建议引入类似生物睡眠的机制来巩固记忆。
LLM在预训练后停止学习,成为静态模型。 模型患有“顺行性遗忘症”,无法形成新的长期记忆。 序列知识#874:Transformer还是不是? 2026-06-09 19:03 UTC+8 Transformer架构目前是AI领域的参考架构,因其出色的扩展性而成为工业标准,但其注意力机制的计算成本高昂。文章探讨了Transformer是否会是最终架构,还是只是第一个真正可扩展的架构。
Transformer的强项是注意力机制,可处理多种数据类型。 注意力机制计算成本高,随序列长度扩展性差。 序列雷达#873:上周AI:足球、S-1和超级模型 2026-06-07 19:00 UTC+8 一场新的AI足球锦标赛、主要模型发布、融资活动以及Anthropic的S-1文件。
LayerLens宣布举办Stratix杯,一个模拟足球锦标赛,前沿AI模型将参与其中。 微软在Build大会上发布了新的MAI模型,标志着AI作为操作系统的趋势。 序列观点第872期:蛋糕是战场:谁真正控制了AI堆栈 2026-06-04 18:58 UTC+8 英伟达CEO黄仁勋将AI堆栈描绘成一个五层蛋糕,强调和谐共生。但从战略角度看,这实际上是五个利润池的垂直战场,真正的控制权在于掌握稀缺层及其相邻的接缝。
黄仁勋的AI蛋糕图景从芯片供应商角度强调了各层相互促进的和谐。 战略家看到的是五个利润池的竞争,每层都可能被商品化。 AI周报 #871:深入解析Claude Opus 4.8 2026-06-03 19:01 UTC+8 Claude Opus 4.8于2026年5月28日发布,虽然版本号仅小幅提升,但在可靠性方面取得了重大进步,包括4倍的校准改进、修复静默跳过工具调用、更好的压缩恢复支持长期任务、动态工作流、自适应思考以及速度提升2.5倍且价格降低3倍的模式。该版本强调模型在长时间运行中的稳定性和诚实度,而非基准测试分数的提升,使其成为生产环境中代理循环的理想基础设施。
Claude Opus 4.8在可靠性方面显著提升,特别是校准和工具调用修复,相比4.7版本错误率降低约4倍。 新特性包括动态工作流、自适应思考和快速模式,使得模型在长时间任务中更稳定且成本更低。 序列知识 #870:液态模型与后Transformer架构探索 2026-06-02 19:03 UTC+8 本文探讨了Transformer架构的局限性,以及液态模型作为一种有前景的替代方案,后者更适用于低延迟、隐私保护的端侧智能场景。
Transformer架构虽主导AI,但全局注意力机制导致推理时内存和计算成本高昂。 液态模型通过动力学方法替代注意力机制,为实时、低功耗设备提供可能。 The Sequence Radar #869:AI上周要闻:Token成为账户单位——Opus 4.8、OpenRouter、Cognition、Snowflake及教皇警告 2026-05-31 19:02 UTC+8 Anthropic发布Claude Opus 4.8,接近运营盈利;OpenRouter、Cognition等公司融资规模惊人;Snowflake与AWS签下60亿美元大单;Pope Leo XIV发布通谕警告AI风险。AI行业正在从以模型为中心的竞争转向以token为计价单位的商业模式。
Anthropic的Claude Opus 4.8在编码和推理能力上小幅提升,并引入努力控制、动态工作流和诚实度测量。 OpenRouter完成1.13亿美元融资,周处理量达25万亿token;Cognition融资10亿美元,其AI开发者Devin撰写89%的内部代码。 序列观点#868:递归是新的扩展定律 2026-05-28 19:02 UTC+8 在AI时代,扩展定律曾驱动进步,但现在递归——模型或系统自我审视、修正、搜索和模拟的能力——正在成为新的扩展维度。这一转变标志着从单次前向传播到循环计算的范式转移。
传统AI进步依赖于更大模型和更多数据,但递归正成为新前沿。 递归使模型能够反复改进答案,而非一次性输出。 AI序列第867期:潜力思考——为什么Sapient的HRM-Text是对思维链的悄然反驳 2026-05-27 19:01 UTC+8 本文批评了大型语言模型中的思维链(CoT)推理方式,认为它效率低下,因为推理过程被迫离开残差流变成离散的token。Sapient Intelligence的HRM-Text模型通过在潜在空间中进行推理来解决这个问题,为固定深度的Transformer提供可变的内部深度,从而挑战当前的推理范式。
思维链(CoT)并非真正的推理,而是一种让模型从输出token中“租用”深度的变通方法。 Sapient Intelligence的HRM-Text将推理放在潜在空间中进行,而非token流中。 序列知识 #866:你需要了解的三款文本扩散模型 2026-05-26 18:49 UTC+8 文本扩散模型挑战了传统自回归语言生成范式,将生成过程视为从噪声或掩码开始、逐步精炼的编辑过程。文章介绍了该领域的三个关键系统:LLaDA(证明扩散可扩展为大型语言模型)、Mercury(实现商业速度优势)和Gemini Diffusion(前沿验证),它们共同代表了新架构类的三阶段:科学证明、工业部署和前沿验证。
文本扩散模型通过迭代去噪而非逐词生成文本,利用双向上下文。 LLaDA证明了扩散模型可以扩展到真正的大语言模型规模。 The Sequence Radar #865:上周AI回顾:Karpathy、Google、Colossus与即将到来的IPO浪潮 2026-05-24 19:00 UTC+8 上周AI领域迎来重大转折:Google发布Gemini Omni及代理优先平台;Andrej Karpathy加入Anthropic,专注于利用Claude加速预训练研究;Anthropic与xAI达成价值450亿美元的Colossus算力租赁协议;Cerebras IPO成功,市值近950亿美元;SpaceX、OpenAI和Anthropic计划在未来六个月内相继上市,总估值可能超过3万亿美元。此外,多项前沿研究发布,包括HRM-Text高效预训练范式、AI评审员效果评估、NVIDIA的联合AR-扩散模型等。
Google在I/O大会上推出Gemini Omni多模态模型和代理优先平台Antigravity,整合TPU 8i实现垂直集成。 Andrej Karpathy加入Anthropic,组建团队利用Claude加速预训练研究,标志着自我改进循环的实质性进展。 《序列观点》第864期:每个AI代理都需要一台电脑 2026-05-21 18:45 UTC+8 AI代理的下一个阶段将由对计算机的访问定义——文件系统、终端、浏览器等,而非仅仅是更好的模型。代理沙箱市场正在兴起。
AI代理需要真实的执行环境,包括文件系统、终端、网络等。 仅能生成令牌的代理如同缸中之脑,缺乏行动能力。 本周AI序列第863期:模型即接口:探索Thinking Machines的交互模型 2026-05-20 19:03 UTC+8 Thinking Machines的交互模型将实时对话、视觉、音频和工具使用融合为一个持续学习的系统。
Thinking Machines推出交互模型,实时整合多模态能力。 当前基于文本的LLM范式无法满足实时协作需求。 序列知识第862期:了解文本扩散模型 2026-05-19 19:03 UTC+8 文本扩散模型作为自回归Transformer模型在语言生成领域的可信替代方案正在兴起,克服了生成漂移和反转诅咒等局限。
扩散模型主导视觉AI,但在文本领域长期被忽视。 自回归模型存在固有问题:从左到右生成、缺乏全局规划、错误级联。 序列雷达 #861:上周AI要闻——IPO、交互式模型与递归之梦 2026-05-17 19:02 UTC+8 上周AI领域迎来多个重要事件:Cerebras IPO使其市值飙升至950亿美元;Thinking Machines推出将交互能力内建于模型本身的“交互式模型”;前Salesforce首席科学家Richard Socher创立Recursive Superintelligence,致力于通过自动实验实现AI自我改进;前阿里巴巴Qwen负责人林俊阳以约20亿美元估值创办新AI实验室。
Cerebras IPO首日大涨68%,市值达950亿美元,凸显AI硬件的重要性。 Thinking Machines发布研究预览版交互式模型,将实时协作作为模型本身的一部分。 序列观点 #860:每个公司的最后一考——关于实用AI评估的一些思考 2026-05-14 19:03 UTC+8 随着AI系统从聊天机器人升级为智能体,评估正成为继算力、数据和模型之后的第四大支柱。每个公司都需要建立自己的动态评估体系,而非依赖通用基准。
评估将成为现代AI的第四大支柱。 企业需要针对自身工作流程的私有评估体系。 Sequence AI 本周第859期:用英语解读Claude的思维——自然语言自编码器简介 2026-05-13 19:50 UTC+8 Anthropic 的新型自然语言自编码器让研究人员能够直接获取LLM思维活动的英语描述,这是可解释性研究的重要进展。
Anthropic 推出自然语言自编码器(NLA),可无监督地生成LLM激活的英语解释。 NLA 允许研究人员询问“你在想什么?”并得到要点式回答。 序列知识 #858:状态空间模型如何从新奇之物蜕变为Transformer的强劲对手 2026-05-12 18:39 UTC+8 状态空间模型(SSM)凭借线性时间复杂度和恒定内存推理,正在挑战Transformer在序列建模中的主导地位。本文梳理了SSM的数学基础、发展历程及其在语言建模等任务上的表现,指出其已逐渐具备与Transformer竞争的能力。
Transformer的自注意力机制存在O(n²)的复杂度问题,限制了超长上下文窗口的扩展。 状态空间模型提供线性复杂度、无KV缓存,推理时内存恒定。 序列雷达 #857:上周AI速览:机器内部,文本框之外 2026-05-10 19:01 UTC+8 本周AI领域呈现科学化、产品化和投机化并存的趋势。Anthropic发布了自然语言自编码器,实现模型内部状态的语言化解释;OpenAI推出新语音模型,推动AI向原生界面演进;SubQ声称拥有1200万token上下文窗口,挑战现有RAG架构;中国AI实验室DeepSeek和Moonshot估值飙升,市场将AI公司视为战略资产。整体而言,AI正从模型竞赛转向基础设施竞赛。
Anthropic的自然语言自编码器将模型激活压缩为自然语言,开创了可解释性的新范式 OpenAI语音模型使AI从文本界面转向实时语音代理,用户体验发生质变 序列观点第856期:代理领域的Salesforce不会是Salesforce,代理领域的Google不会是Google 2026-05-07 19:02 UTC+8 本文探讨AI代理如何重塑软件行业,认为在代理经济中,主导者不会是现有的科技巨头。
传统软件假设用户是人类,整个SaaS和消费互联网栈围绕人类用户构建。 AI代理的出现改变了这一假设,软件需要为机器用户设计。 The Sequence 本周AI第855期:深入解析Nemotron Omni——NVIDIA为智能体打造的新多模态大脑 2026-05-06 18:30 UTC+8 NVIDIA的Nemotron 3 Nano Omni是一款多模态推理模型,将视频、音频、图像和文本处理统一到单个高效模型中,用于智能体工作流,避免了分离模型带来的有损管道。
Nemotron 3 Nano Omni将视频、音频、图像和文本整合到一个模型中。 旨在取代由独立ASR、VLM和OCR模型组成的碎片化管道。