TheSequence AI 新聞來源

公開文章 39採集文章 40可信度 82刷新頻率 720 分鐘

健康狀態健康來源類型研究原文權限 站內改寫最近入庫 2026-06-26ID the-sequence運行狀態 已啟用

AI research and engineering newsletter; summary-only unless authorization is obtained.

最新公開文章

自驅動實驗室：選擇下一個實驗的實驗室

2026-06-26 18:58 UTC+8

自驅動實驗室通過將AI與自動化實驗硬件結合，使系統能夠根據實驗結果自主決定下一步實驗，區別於僅執行預設腳本的自動化。

自驅動實驗室的核心是AI與自動化硬件的結合，實現實驗決策的自主化。
與自動化不同，自驅動實驗室會通過實驗實時學習並調整實驗方向。

AI週報#883：Qwen進軍機器人領域

2026-06-25 19:01 UTC+8

阿里巴巴的Qwen模型家族推出機器人套件，旨在彌合感知與行動之間的鴻溝。三個新模型分別專注於導航、操作和世界建模，核心挑戰在於將物理動作轉化為可學習的token。

Qwen模型長期侷限於軟件環境，無法執行物理操作。
阿里巴巴發佈Qwen-Robot Suite，包含三個專用模型。

序列知識#882：關於蒸餾技術的新系列

2026-06-24 18:35 UTC+8

深入探討現代AI中最重要的技術之一——蒸餾，以及它如何解決大規模模型帶來的成本、部署和專業化問題。

蒸餾技術使AI模型更高效、更易部署，是應對規模帶來的挑戰的關鍵。
規模推動了AI進步，但也導致模型昂貴、緩慢、難以專業化。

The Sequence Special #881：人工智能模型的足球世界盃

2026-06-22 19:34 UTC+8

LayerLens 推出 Stratix 杯，這是一場頂級 AI 模型在模擬環境中作為智能體進行足球比賽，考驗規劃、適應和多智能體協調能力。

LayerLens 推出 Stratix 杯，這是一個 AI 模型的足球錦標賽。
比賽測試智能體能力：賽前策略、實時比賽和半場調整。

序列雷達 #880：上週AI要聞——600億美元Cursor交易、谷歌人才流失、Midjourney的人體掃描儀

2026-06-21 19:02 UTC+8

AI市場上一週出現了一系列意想不到的轉折：SpaceX以600億美元收購Cursor，Noam Shazeer和John Jumper分別離開谷歌加入OpenAI和Anthropic，Midjourney推出全身醫用掃描儀。

1. SpaceX以600億美元股票收購Cursor，標誌着AI工具已成為與火箭發射能力同等重要的戰略基礎設施。
2. Noam Shazeer和John Jumper相繼離開谷歌，凸顯了AI前沿領域激烈的人才爭奪戰，頂尖研究者成為最稀缺的資源。

序列AI本週第878期：谷歌DeepMind首次真正突破下一代令牌生成

2026-06-17 18:56 UTC+8

谷歌DeepMind發佈了DiffusionGemma，這是一種文本擴散模型，挑戰了傳統的Transformer架構。該模型不依賴從左到右逐令牌生成文本的方式，而是採用全新的生成機制。

DiffusionGemma是谷歌DeepMind發佈的一種文本擴散模型。
該模型挑戰了傳統的Transformer架構。

序列知識 #878：超越Transformer：我們學到的

2026-06-16 19:03 UTC+8

本文總結了關於Transformer替代方案的系列文章，涵蓋四大類模型：遞歸/線性遞歸模型、狀態空間模型、文本擴散模型和液態/連續時間模型。同時宣佈將推出關於知識蒸餾的新系列。

自注意力機制帶來二次方複雜度，長序列計算和內存成本高昂。
四種替代方向：遞歸模型（恆內存）、狀態空間模型（線性縮放）、文本擴散（並行生成）、液態模型（連續時間動態）。

《序列雷達》第877期：上週AI大事記——Anthropic發佈模型，蘋果借用技術，馬斯克上市，貝佐斯建廠

2026-06-14 19:03 UTC+8

上週AI領域發生四大重磅事件：Anthropic推出Claude Fable 5和Mythos 5，蘋果發佈Siri AI，SpaceX以史上最大IPO上市，貝佐斯的Prometheus融資120億美元。這些事件標誌着AI正從聊天窗口走向更廣泛的物理世界。

Anthropic發佈Claude Fable 5與Mythos 5，能力與訪問權限分離
蘋果推出Siri AI，搭載1.2萬億參數Gemini模型，利用個人上下文優勢

序列觀點：記錄系統與行動系統

2026-06-11 19:03 UTC+8

討論代理型AI時代企業軟件的新範式：從記錄系統轉向行動系統。

傳統企業軟件以人為核心，記錄狀態。
代理型AI將改變軟件的作用，重點轉向可靠地執行行動。

本週AI序列 #875：為什麼你的語言模型需要小憩

2026-06-10 18:39 UTC+8

論文《語言模型需要睡眠》提出，大語言模型存在“順行性遺忘症”，無法在訓練後學習新知識，建議引入類似生物睡眠的機制來鞏固記憶。

LLM在預訓練後停止學習，成為靜態模型。
模型患有“順行性遺忘症”，無法形成新的長期記憶。

序列知識#874：Transformer還是不是？

2026-06-09 19:03 UTC+8

Transformer架構目前是AI領域的參考架構，因其出色的擴展性而成為工業標準，但其注意力機制的計算成本高昂。文章探討了Transformer是否會是最終架構，還是隻是第一個真正可擴展的架構。

Transformer的強項是注意力機制，可處理多種數據類型。
注意力機制計算成本高，隨序列長度擴展性差。

序列雷達#873：上週AI：足球、S-1和超級模型

2026-06-07 19:00 UTC+8

一場新的AI足球錦標賽、主要模型發佈、融資活動以及Anthropic的S-1文件。

LayerLens宣佈舉辦Stratix杯，一個模擬足球錦標賽，前沿AI模型將參與其中。
微軟在Build大會上發佈了新的MAI模型，標誌着AI作為操作系統的趨勢。

序列觀點第872期：蛋糕是戰場：誰真正控制了AI堆棧

2026-06-04 18:58 UTC+8

英偉達CEO黃仁勳將AI堆棧描繪成一個五層蛋糕，強調和諧共生。但從戰略角度看，這實際上是五個利潤池的垂直戰場，真正的控制權在於掌握稀缺層及其相鄰的接縫。

黃仁勳的AI蛋糕圖景從芯片供應商角度強調了各層相互促進的和諧。
戰略家看到的是五個利潤池的競爭，每層都可能被商品化。

AI週報 #871：深入解析Claude Opus 4.8

2026-06-03 19:01 UTC+8

Claude Opus 4.8於2026年5月28日發佈，雖然版本號僅小幅提升，但在可靠性方面取得了重大進步，包括4倍的校準改進、修復靜默跳過工具調用、更好的壓縮恢復支持長期任務、動態工作流、自適應思考以及速度提升2.5倍且價格降低3倍的模式。該版本強調模型在長時間運行中的穩定性和誠實度，而非基準測試分數的提升，使其成為生產環境中代理循環的理想基礎設施。

Claude Opus 4.8在可靠性方面顯著提升，特別是校準和工具調用修復，相比4.7版本錯誤率降低約4倍。
新特性包括動態工作流、自適應思考和快速模式，使得模型在長時間任務中更穩定且成本更低。

序列知識 #870：液態模型與後Transformer架構探索

2026-06-02 19:03 UTC+8

本文探討了Transformer架構的侷限性，以及液態模型作為一種有前景的替代方案，後者更適用於低延遲、隱私保護的端側智能場景。

Transformer架構雖主導AI，但全局注意力機制導致推理時內存和計算成本高昂。
液態模型通過動力學方法替代注意力機制，為實時、低功耗設備提供可能。

The Sequence Radar #869：AI上週要聞：Token成為賬户單位——Opus 4.8、OpenRouter、Cognition、Snowflake及教皇警告

2026-05-31 19:02 UTC+8

Anthropic發佈Claude Opus 4.8，接近運營盈利；OpenRouter、Cognition等公司融資規模驚人；Snowflake與AWS簽下60億美元大單；Pope Leo XIV發佈通諭警告AI風險。AI行業正在從以模型為中心的競爭轉向以token為計價單位的商業模式。

Anthropic的Claude Opus 4.8在編碼和推理能力上小幅提升，並引入努力控制、動態工作流和誠實度測量。
OpenRouter完成1.13億美元融資，周處理量達25萬億token；Cognition融資10億美元，其AI開發者Devin撰寫89%的內部代碼。

序列觀點#868：遞歸是新的擴展定律

2026-05-28 19:02 UTC+8

在AI時代，擴展定律曾驅動進步，但現在遞歸——模型或系統自我審視、修正、搜索和模擬的能力——正在成為新的擴展維度。這一轉變標誌着從單次前向傳播到循環計算的範式轉移。

傳統AI進步依賴於更大模型和更多數據，但遞歸正成為新前沿。
遞歸使模型能夠反覆改進答案，而非一次性輸出。

AI序列第867期：潛力思考——為什麼Sapient的HRM-Text是對思維鏈的悄然反駁

2026-05-27 19:01 UTC+8

本文批評了大型語言模型中的思維鏈（CoT）推理方式，認為它效率低下，因為推理過程被迫離開殘差流變成離散的token。Sapient Intelligence的HRM-Text模型通過在潛在空間中進行推理來解決這個問題，為固定深度的Transformer提供可變的內部深度，從而挑戰當前的推理範式。

思維鏈（CoT）並非真正的推理，而是一種讓模型從輸出token中“租用”深度的變通方法。
Sapient Intelligence的HRM-Text將推理放在潛在空間中進行，而非token流中。

序列知識 #866：你需要了解的三款文本擴散模型

2026-05-26 18:49 UTC+8

文本擴散模型挑戰了傳統自迴歸語言生成範式，將生成過程視為從噪聲或掩碼開始、逐步精煉的編輯過程。文章介紹了該領域的三個關鍵系統：LLaDA（證明擴散可擴展為大型語言模型）、Mercury（實現商業速度優勢）和Gemini Diffusion（前沿驗證），它們共同代表了新架構類的三階段：科學證明、工業部署和前沿驗證。

文本擴散模型通過迭代去噪而非逐詞生成文本，利用雙向上下文。
LLaDA證明了擴散模型可以擴展到真正的大語言模型規模。

The Sequence Radar #865：上週AI回顧：Karpathy、Google、Colossus與即將到來的IPO浪潮

2026-05-24 19:00 UTC+8

上週AI領域迎來重大轉折：Google發佈Gemini Omni及代理優先平台；Andrej Karpathy加入Anthropic，專注於利用Claude加速預訓練研究；Anthropic與xAI達成價值450億美元的Colossus算力租賃協議；Cerebras IPO成功，市值近950億美元；SpaceX、OpenAI和Anthropic計劃在未來六個月內相繼上市，總估值可能超過3萬億美元。此外，多項前沿研究發佈，包括HRM-Text高效預訓練範式、AI評審員效果評估、NVIDIA的聯合AR-擴散模型等。

Google在I/O大會上推出Gemini Omni多模態模型和代理優先平台Antigravity，整合TPU 8i實現垂直集成。
Andrej Karpathy加入Anthropic，組建團隊利用Claude加速預訓練研究，標誌着自我改進循環的實質性進展。

《序列觀點》第864期：每個AI代理都需要一台電腦

2026-05-21 18:45 UTC+8

AI代理的下一個階段將由對計算機的訪問定義——文件系統、終端、瀏覽器等，而非僅僅是更好的模型。代理沙箱市場正在興起。

AI代理需要真實的執行環境，包括文件系統、終端、網絡等。
僅能生成令牌的代理如同缸中之腦，缺乏行動能力。

本週AI序列第863期：模型即接口：探索Thinking Machines的交互模型

2026-05-20 19:03 UTC+8

Thinking Machines的交互模型將實時對話、視覺、音頻和工具使用融合為一個持續學習的系統。

Thinking Machines推出交互模型，實時整合多模態能力。
當前基於文本的LLM範式無法滿足實時協作需求。

序列知識第862期：瞭解文本擴散模型

2026-05-19 19:03 UTC+8

文本擴散模型作為自迴歸Transformer模型在語言生成領域的可信替代方案正在興起，克服了生成漂移和反轉詛咒等侷限。

擴散模型主導視覺AI，但在文本領域長期被忽視。
自迴歸模型存在固有問題：從左到右生成、缺乏全局規劃、錯誤級聯。

序列雷達 #861：上週AI要聞——IPO、交互式模型與遞歸之夢

2026-05-17 19:02 UTC+8

上週AI領域迎來多個重要事件：Cerebras IPO使其市值飆升至950億美元；Thinking Machines推出將交互能力內建於模型本身的“交互式模型”；前Salesforce首席科學家Richard Socher創立Recursive Superintelligence，致力於通過自動實驗實現AI自我改進；前阿里巴巴Qwen負責人林俊陽以約20億美元估值創辦新AI實驗室。

Cerebras IPO首日大漲68%，市值達950億美元，凸顯AI硬件的重要性。
Thinking Machines發佈研究預覽版交互式模型，將實時協作作為模型本身的一部分。

序列觀點 #860：每個公司的最後一考——關於實用AI評估的一些思考

2026-05-14 19:03 UTC+8

隨着AI系統從聊天機器人升級為智能體，評估正成為繼算力、數據和模型之後的第四大支柱。每個公司都需要建立自己的動態評估體系，而非依賴通用基準。

評估將成為現代AI的第四大支柱。
企業需要針對自身工作流程的私有評估體系。

Sequence AI 本週第859期：用英語解讀Claude的思維——自然語言自編碼器簡介

2026-05-13 19:50 UTC+8

Anthropic 的新型自然語言自編碼器讓研究人員能夠直接獲取LLM思維活動的英語描述，這是可解釋性研究的重要進展。

Anthropic 推出自然語言自編碼器（NLA），可無監督地生成LLM激活的英語解釋。
NLA 允許研究人員詢問“你在想什麼？”並得到要點式回答。

序列知識 #858：狀態空間模型如何從新奇之物蜕變為Transformer的強勁對手

2026-05-12 18:39 UTC+8

狀態空間模型（SSM）憑藉線性時間複雜度和恆定內存推理，正在挑戰Transformer在序列建模中的主導地位。本文梳理了SSM的數學基礎、發展歷程及其在語言建模等任務上的表現，指出其已逐漸具備與Transformer競爭的能力。

Transformer的自注意力機制存在O(n²)的複雜度問題，限制了超長上下文窗口的擴展。
狀態空間模型提供線性複雜度、無KV緩存，推理時內存恆定。

序列雷達 #857：上週AI速覽：機器內部，文本框之外

2026-05-10 19:01 UTC+8

本週AI領域呈現科學化、產品化和投機化並存的趨勢。Anthropic發佈了自然語言自編碼器，實現模型內部狀態的語言化解釋；OpenAI推出新語音模型，推動AI向原生界面演進；SubQ聲稱擁有1200萬token上下文窗口，挑戰現有RAG架構；中國AI實驗室DeepSeek和Moonshot估值飆升，市場將AI公司視為戰略資產。整體而言，AI正從模型競賽轉向基礎設施競賽。

Anthropic的自然語言自編碼器將模型激活壓縮為自然語言，開創了可解釋性的新範式
OpenAI語音模型使AI從文本界面轉向實時語音代理，用户體驗發生質變

序列觀點第856期：代理領域的Salesforce不會是Salesforce，代理領域的Google不會是Google

2026-05-07 19:02 UTC+8

本文探討AI代理如何重塑軟件行業，認為在代理經濟中，主導者不會是現有的科技巨頭。

傳統軟件假設用户是人類，整個SaaS和消費互聯網棧圍繞人類用户構建。
AI代理的出現改變了這一假設，軟件需要為機器用户設計。

The Sequence 本週AI第855期：深入解析Nemotron Omni——NVIDIA為智能體打造的新多模態大腦

2026-05-06 18:30 UTC+8

NVIDIA的Nemotron 3 Nano Omni是一款多模態推理模型，將視頻、音頻、圖像和文本處理統一到單個高效模型中，用於智能體工作流，避免了分離模型帶來的有損管道。

Nemotron 3 Nano Omni將視頻、音頻、圖像和文本整合到一個模型中。
旨在取代由獨立ASR、VLM和OCR模型組成的碎片化管道。

TheSequence