自驅動實驗室:選擇下一個實驗的實驗室 2026-06-26 18:58 UTC+8 自驅動實驗室通過將AI與自動化實驗硬件結合,使系統能夠根據實驗結果自主決定下一步實驗,區別於僅執行預設腳本的自動化。
自驅動實驗室的核心是AI與自動化硬件的結合,實現實驗決策的自主化。 與自動化不同,自驅動實驗室會通過實驗實時學習並調整實驗方向。 AI週報#883:Qwen進軍機器人領域 2026-06-25 19:01 UTC+8 阿里巴巴的Qwen模型家族推出機器人套件,旨在彌合感知與行動之間的鴻溝。三個新模型分別專注於導航、操作和世界建模,核心挑戰在於將物理動作轉化為可學習的token。
Qwen模型長期侷限於軟件環境,無法執行物理操作。 阿里巴巴發佈Qwen-Robot Suite,包含三個專用模型。 序列知識#882:關於蒸餾技術的新系列 2026-06-24 18:35 UTC+8 深入探討現代AI中最重要的技術之一——蒸餾,以及它如何解決大規模模型帶來的成本、部署和專業化問題。
蒸餾技術使AI模型更高效、更易部署,是應對規模帶來的挑戰的關鍵。 規模推動了AI進步,但也導致模型昂貴、緩慢、難以專業化。 The Sequence Special #881:人工智能模型的足球世界盃 2026-06-22 19:34 UTC+8 LayerLens 推出 Stratix 杯,這是一場頂級 AI 模型在模擬環境中作為智能體進行足球比賽,考驗規劃、適應和多智能體協調能力。
LayerLens 推出 Stratix 杯,這是一個 AI 模型的足球錦標賽。 比賽測試智能體能力:賽前策略、實時比賽和半場調整。 序列雷達 #880:上週AI要聞——600億美元Cursor交易、谷歌人才流失、Midjourney的人體掃描儀 2026-06-21 19:02 UTC+8 AI市場上一週出現了一系列意想不到的轉折:SpaceX以600億美元收購Cursor,Noam Shazeer和John Jumper分別離開谷歌加入OpenAI和Anthropic,Midjourney推出全身醫用掃描儀。
1. SpaceX以600億美元股票收購Cursor,標誌着AI工具已成為與火箭發射能力同等重要的戰略基礎設施。 2. Noam Shazeer和John Jumper相繼離開谷歌,凸顯了AI前沿領域激烈的人才爭奪戰,頂尖研究者成為最稀缺的資源。 序列AI本週第878期:谷歌DeepMind首次真正突破下一代令牌生成 2026-06-17 18:56 UTC+8 谷歌DeepMind發佈了DiffusionGemma,這是一種文本擴散模型,挑戰了傳統的Transformer架構。該模型不依賴從左到右逐令牌生成文本的方式,而是採用全新的生成機制。
DiffusionGemma是谷歌DeepMind發佈的一種文本擴散模型。 該模型挑戰了傳統的Transformer架構。 序列知識 #878:超越Transformer:我們學到的 2026-06-16 19:03 UTC+8 本文總結了關於Transformer替代方案的系列文章,涵蓋四大類模型:遞歸/線性遞歸模型、狀態空間模型、文本擴散模型和液態/連續時間模型。同時宣佈將推出關於知識蒸餾的新系列。
自注意力機制帶來二次方複雜度,長序列計算和內存成本高昂。 四種替代方向:遞歸模型(恆內存)、狀態空間模型(線性縮放)、文本擴散(並行生成)、液態模型(連續時間動態)。 《序列雷達》第877期:上週AI大事記——Anthropic發佈模型,蘋果借用技術,馬斯克上市,貝佐斯建廠 2026-06-14 19:03 UTC+8 上週AI領域發生四大重磅事件:Anthropic推出Claude Fable 5和Mythos 5,蘋果發佈Siri AI,SpaceX以史上最大IPO上市,貝佐斯的Prometheus融資120億美元。這些事件標誌着AI正從聊天窗口走向更廣泛的物理世界。
Anthropic發佈Claude Fable 5與Mythos 5,能力與訪問權限分離 蘋果推出Siri AI,搭載1.2萬億參數Gemini模型,利用個人上下文優勢 序列觀點:記錄系統與行動系統 2026-06-11 19:03 UTC+8 討論代理型AI時代企業軟件的新範式:從記錄系統轉向行動系統。
傳統企業軟件以人為核心,記錄狀態。 代理型AI將改變軟件的作用,重點轉向可靠地執行行動。 本週AI序列 #875:為什麼你的語言模型需要小憩 2026-06-10 18:39 UTC+8 論文《語言模型需要睡眠》提出,大語言模型存在“順行性遺忘症”,無法在訓練後學習新知識,建議引入類似生物睡眠的機制來鞏固記憶。
LLM在預訓練後停止學習,成為靜態模型。 模型患有“順行性遺忘症”,無法形成新的長期記憶。 序列知識#874:Transformer還是不是? 2026-06-09 19:03 UTC+8 Transformer架構目前是AI領域的參考架構,因其出色的擴展性而成為工業標準,但其注意力機制的計算成本高昂。文章探討了Transformer是否會是最終架構,還是隻是第一個真正可擴展的架構。
Transformer的強項是注意力機制,可處理多種數據類型。 注意力機制計算成本高,隨序列長度擴展性差。 序列雷達#873:上週AI:足球、S-1和超級模型 2026-06-07 19:00 UTC+8 一場新的AI足球錦標賽、主要模型發佈、融資活動以及Anthropic的S-1文件。
LayerLens宣佈舉辦Stratix杯,一個模擬足球錦標賽,前沿AI模型將參與其中。 微軟在Build大會上發佈了新的MAI模型,標誌着AI作為操作系統的趨勢。 序列觀點第872期:蛋糕是戰場:誰真正控制了AI堆棧 2026-06-04 18:58 UTC+8 英偉達CEO黃仁勳將AI堆棧描繪成一個五層蛋糕,強調和諧共生。但從戰略角度看,這實際上是五個利潤池的垂直戰場,真正的控制權在於掌握稀缺層及其相鄰的接縫。
黃仁勳的AI蛋糕圖景從芯片供應商角度強調了各層相互促進的和諧。 戰略家看到的是五個利潤池的競爭,每層都可能被商品化。 AI週報 #871:深入解析Claude Opus 4.8 2026-06-03 19:01 UTC+8 Claude Opus 4.8於2026年5月28日發佈,雖然版本號僅小幅提升,但在可靠性方面取得了重大進步,包括4倍的校準改進、修復靜默跳過工具調用、更好的壓縮恢復支持長期任務、動態工作流、自適應思考以及速度提升2.5倍且價格降低3倍的模式。該版本強調模型在長時間運行中的穩定性和誠實度,而非基準測試分數的提升,使其成為生產環境中代理循環的理想基礎設施。
Claude Opus 4.8在可靠性方面顯著提升,特別是校準和工具調用修復,相比4.7版本錯誤率降低約4倍。 新特性包括動態工作流、自適應思考和快速模式,使得模型在長時間任務中更穩定且成本更低。 序列知識 #870:液態模型與後Transformer架構探索 2026-06-02 19:03 UTC+8 本文探討了Transformer架構的侷限性,以及液態模型作為一種有前景的替代方案,後者更適用於低延遲、隱私保護的端側智能場景。
Transformer架構雖主導AI,但全局注意力機制導致推理時內存和計算成本高昂。 液態模型通過動力學方法替代注意力機制,為實時、低功耗設備提供可能。 The Sequence Radar #869:AI上週要聞:Token成為賬户單位——Opus 4.8、OpenRouter、Cognition、Snowflake及教皇警告 2026-05-31 19:02 UTC+8 Anthropic發佈Claude Opus 4.8,接近運營盈利;OpenRouter、Cognition等公司融資規模驚人;Snowflake與AWS簽下60億美元大單;Pope Leo XIV發佈通諭警告AI風險。AI行業正在從以模型為中心的競爭轉向以token為計價單位的商業模式。
Anthropic的Claude Opus 4.8在編碼和推理能力上小幅提升,並引入努力控制、動態工作流和誠實度測量。 OpenRouter完成1.13億美元融資,周處理量達25萬億token;Cognition融資10億美元,其AI開發者Devin撰寫89%的內部代碼。 序列觀點#868:遞歸是新的擴展定律 2026-05-28 19:02 UTC+8 在AI時代,擴展定律曾驅動進步,但現在遞歸——模型或系統自我審視、修正、搜索和模擬的能力——正在成為新的擴展維度。這一轉變標誌着從單次前向傳播到循環計算的範式轉移。
傳統AI進步依賴於更大模型和更多數據,但遞歸正成為新前沿。 遞歸使模型能夠反覆改進答案,而非一次性輸出。 AI序列第867期:潛力思考——為什麼Sapient的HRM-Text是對思維鏈的悄然反駁 2026-05-27 19:01 UTC+8 本文批評了大型語言模型中的思維鏈(CoT)推理方式,認為它效率低下,因為推理過程被迫離開殘差流變成離散的token。Sapient Intelligence的HRM-Text模型通過在潛在空間中進行推理來解決這個問題,為固定深度的Transformer提供可變的內部深度,從而挑戰當前的推理範式。
思維鏈(CoT)並非真正的推理,而是一種讓模型從輸出token中“租用”深度的變通方法。 Sapient Intelligence的HRM-Text將推理放在潛在空間中進行,而非token流中。 序列知識 #866:你需要了解的三款文本擴散模型 2026-05-26 18:49 UTC+8 文本擴散模型挑戰了傳統自迴歸語言生成範式,將生成過程視為從噪聲或掩碼開始、逐步精煉的編輯過程。文章介紹了該領域的三個關鍵系統:LLaDA(證明擴散可擴展為大型語言模型)、Mercury(實現商業速度優勢)和Gemini Diffusion(前沿驗證),它們共同代表了新架構類的三階段:科學證明、工業部署和前沿驗證。
文本擴散模型通過迭代去噪而非逐詞生成文本,利用雙向上下文。 LLaDA證明了擴散模型可以擴展到真正的大語言模型規模。 The Sequence Radar #865:上週AI回顧:Karpathy、Google、Colossus與即將到來的IPO浪潮 2026-05-24 19:00 UTC+8 上週AI領域迎來重大轉折:Google發佈Gemini Omni及代理優先平台;Andrej Karpathy加入Anthropic,專注於利用Claude加速預訓練研究;Anthropic與xAI達成價值450億美元的Colossus算力租賃協議;Cerebras IPO成功,市值近950億美元;SpaceX、OpenAI和Anthropic計劃在未來六個月內相繼上市,總估值可能超過3萬億美元。此外,多項前沿研究發佈,包括HRM-Text高效預訓練範式、AI評審員效果評估、NVIDIA的聯合AR-擴散模型等。
Google在I/O大會上推出Gemini Omni多模態模型和代理優先平台Antigravity,整合TPU 8i實現垂直集成。 Andrej Karpathy加入Anthropic,組建團隊利用Claude加速預訓練研究,標誌着自我改進循環的實質性進展。 《序列觀點》第864期:每個AI代理都需要一台電腦 2026-05-21 18:45 UTC+8 AI代理的下一個階段將由對計算機的訪問定義——文件系統、終端、瀏覽器等,而非僅僅是更好的模型。代理沙箱市場正在興起。
AI代理需要真實的執行環境,包括文件系統、終端、網絡等。 僅能生成令牌的代理如同缸中之腦,缺乏行動能力。 本週AI序列第863期:模型即接口:探索Thinking Machines的交互模型 2026-05-20 19:03 UTC+8 Thinking Machines的交互模型將實時對話、視覺、音頻和工具使用融合為一個持續學習的系統。
Thinking Machines推出交互模型,實時整合多模態能力。 當前基於文本的LLM範式無法滿足實時協作需求。 序列知識第862期:瞭解文本擴散模型 2026-05-19 19:03 UTC+8 文本擴散模型作為自迴歸Transformer模型在語言生成領域的可信替代方案正在興起,克服了生成漂移和反轉詛咒等侷限。
擴散模型主導視覺AI,但在文本領域長期被忽視。 自迴歸模型存在固有問題:從左到右生成、缺乏全局規劃、錯誤級聯。 序列雷達 #861:上週AI要聞——IPO、交互式模型與遞歸之夢 2026-05-17 19:02 UTC+8 上週AI領域迎來多個重要事件:Cerebras IPO使其市值飆升至950億美元;Thinking Machines推出將交互能力內建於模型本身的“交互式模型”;前Salesforce首席科學家Richard Socher創立Recursive Superintelligence,致力於通過自動實驗實現AI自我改進;前阿里巴巴Qwen負責人林俊陽以約20億美元估值創辦新AI實驗室。
Cerebras IPO首日大漲68%,市值達950億美元,凸顯AI硬件的重要性。 Thinking Machines發佈研究預覽版交互式模型,將實時協作作為模型本身的一部分。 序列觀點 #860:每個公司的最後一考——關於實用AI評估的一些思考 2026-05-14 19:03 UTC+8 隨着AI系統從聊天機器人升級為智能體,評估正成為繼算力、數據和模型之後的第四大支柱。每個公司都需要建立自己的動態評估體系,而非依賴通用基準。
評估將成為現代AI的第四大支柱。 企業需要針對自身工作流程的私有評估體系。 Sequence AI 本週第859期:用英語解讀Claude的思維——自然語言自編碼器簡介 2026-05-13 19:50 UTC+8 Anthropic 的新型自然語言自編碼器讓研究人員能夠直接獲取LLM思維活動的英語描述,這是可解釋性研究的重要進展。
Anthropic 推出自然語言自編碼器(NLA),可無監督地生成LLM激活的英語解釋。 NLA 允許研究人員詢問“你在想什麼?”並得到要點式回答。 序列知識 #858:狀態空間模型如何從新奇之物蜕變為Transformer的強勁對手 2026-05-12 18:39 UTC+8 狀態空間模型(SSM)憑藉線性時間複雜度和恆定內存推理,正在挑戰Transformer在序列建模中的主導地位。本文梳理了SSM的數學基礎、發展歷程及其在語言建模等任務上的表現,指出其已逐漸具備與Transformer競爭的能力。
Transformer的自注意力機制存在O(n²)的複雜度問題,限制了超長上下文窗口的擴展。 狀態空間模型提供線性複雜度、無KV緩存,推理時內存恆定。 序列雷達 #857:上週AI速覽:機器內部,文本框之外 2026-05-10 19:01 UTC+8 本週AI領域呈現科學化、產品化和投機化並存的趨勢。Anthropic發佈了自然語言自編碼器,實現模型內部狀態的語言化解釋;OpenAI推出新語音模型,推動AI向原生界面演進;SubQ聲稱擁有1200萬token上下文窗口,挑戰現有RAG架構;中國AI實驗室DeepSeek和Moonshot估值飆升,市場將AI公司視為戰略資產。整體而言,AI正從模型競賽轉向基礎設施競賽。
Anthropic的自然語言自編碼器將模型激活壓縮為自然語言,開創了可解釋性的新範式 OpenAI語音模型使AI從文本界面轉向實時語音代理,用户體驗發生質變 序列觀點第856期:代理領域的Salesforce不會是Salesforce,代理領域的Google不會是Google 2026-05-07 19:02 UTC+8 本文探討AI代理如何重塑軟件行業,認為在代理經濟中,主導者不會是現有的科技巨頭。
傳統軟件假設用户是人類,整個SaaS和消費互聯網棧圍繞人類用户構建。 AI代理的出現改變了這一假設,軟件需要為機器用户設計。 The Sequence 本週AI第855期:深入解析Nemotron Omni——NVIDIA為智能體打造的新多模態大腦 2026-05-06 18:30 UTC+8 NVIDIA的Nemotron 3 Nano Omni是一款多模態推理模型,將視頻、音頻、圖像和文本處理統一到單個高效模型中,用於智能體工作流,避免了分離模型帶來的有損管道。
Nemotron 3 Nano Omni將視頻、音頻、圖像和文本整合到一個模型中。 旨在取代由獨立ASR、VLM和OCR模型組成的碎片化管道。