AI News HubLIVE
公開文章 39採集文章 40可信度 82刷新頻率 720 分鐘
健康狀態 健康來源類型 研究原文權限 站內改寫最近入庫 2026-06-26ID the-sequence運行狀態 已啟用

AI research and engineering newsletter; summary-only unless authorization is obtained.

最新公開文章

自驅動實驗室:選擇下一個實驗的實驗室

自驅動實驗室透過將AI與自動化實驗硬體結合,使系統能夠根據實驗結果自主決定下一步實驗,區別於僅執行預設指令碼的自動化。

  • 自驅動實驗室的核心是AI與自動化硬體的結合,實現實驗決策的自主化。
  • 與自動化不同,自驅動實驗室會透過實驗即時學習並調整實驗方向。
站內正文

AI週報#883:Qwen進軍機器人領域

阿里巴巴的Qwen模型家族推出機器人套件,旨在彌合感知與行動之間的鴻溝。三個新模型分別專注於導航、操作和世界建模,核心挑戰在於將物理動作轉化為可學習的token。

  • Qwen模型長期侷限於軟體環境,無法執行物理操作。
  • 阿里巴巴釋出Qwen-Robot Suite,包含三個專用模型。
站內正文

序列知識#882:關於蒸餾技術的新系列

深入探討現代AI中最重要的技術之一——蒸餾,以及它如何解決大規模模型帶來的成本、部署和專業化問題。

  • 蒸餾技術使AI模型更高效、更易部署,是應對規模帶來的挑戰的關鍵。
  • 規模推動了AI進步,但也導致模型昂貴、緩慢、難以專業化。
站內正文

The Sequence Special #881:人工智慧模型的足球世界盃

LayerLens 推出 Stratix 杯,這是一場頂級 AI 模型在模擬環境中作為智慧體進行足球比賽,考驗規劃、適應和多智慧體協調能力。

  • LayerLens 推出 Stratix 杯,這是一個 AI 模型的足球錦標賽。
  • 比賽測試智慧體能力:賽前策略、即時比賽和半場調整。
站內正文

序列雷達 #880:上週AI要聞——600億美元Cursor交易、谷歌人才流失、Midjourney的人體掃描器

AI市場上一週出現了一系列意想不到的轉折:SpaceX以600億美元收購Cursor,Noam Shazeer和John Jumper分別離開谷歌加入OpenAI和Anthropic,Midjourney推出全身醫用掃描器。

  • 1. SpaceX以600億美元股票收購Cursor,標誌著AI工具已成為與火箭發射能力同等重要的戰略基礎設施。
  • 2. Noam Shazeer和John Jumper相繼離開谷歌,凸顯了AI前沿領域激烈的人才爭奪戰,頂尖研究者成為最稀缺的資源。
站內正文

序列AI本週第878期:谷歌DeepMind首次真正突破下一代令牌生成

谷歌DeepMind釋出了DiffusionGemma,這是一種文本擴散模型,挑戰了傳統的Transformer架構。該模型不依賴從左到右逐令牌生成文本的方式,而是採用全新的生成機制。

  • DiffusionGemma是谷歌DeepMind釋出的一種文本擴散模型。
  • 該模型挑戰了傳統的Transformer架構。
站內正文

序列知識 #878:超越Transformer:我們學到的

本文總結了關於Transformer替代方案的系列文章,涵蓋四大類模型:遞迴/線性遞迴模型、狀態空間模型、文本擴散模型和液態/連續時間模型。同時宣佈將推出關於知識蒸餾的新系列。

  • 自注意力機制帶來二次方複雜度,長序列計算和記憶體成本高昂。
  • 四種替代方向:遞迴模型(恆記憶體)、狀態空間模型(線性縮放)、文本擴散(並行生成)、液態模型(連續時間動態)。
站內正文

《序列雷達》第877期:上週AI大事記——Anthropic釋出模型,蘋果借用技術,馬斯克上市,貝佐斯建廠

上週AI領域發生四大重磅事件:Anthropic推出Claude Fable 5和Mythos 5,蘋果釋出Siri AI,SpaceX以史上最大IPO上市,貝佐斯的Prometheus融資120億美元。這些事件標誌著AI正從聊天視窗走向更廣泛的物理世界。

  • Anthropic釋出Claude Fable 5與Mythos 5,能力與訪問許可權分離
  • 蘋果推出Siri AI,搭載1.2萬億引數Gemini模型,利用個人上下文優勢
站內正文

序列觀點:記錄系統與行動系統

討論代理型AI時代企業軟體的新正規化:從記錄系統轉向行動系統。

  • 傳統企業軟體以人為核心,記錄狀態。
  • 代理型AI將改變軟體的作用,重點轉向可靠地執行行動。
站內正文

本週AI序列 #875:為什麼你的語言模型需要小憩

論文《語言模型需要睡眠》提出,大語言模型存在“順行性遺忘症”,無法在訓練後學習新知識,建議引入類似生物睡眠的機制來鞏固記憶。

  • LLM在預訓練後停止學習,成為靜態模型。
  • 模型患有“順行性遺忘症”,無法形成新的長期記憶。
站內正文

序列知識#874:Transformer還是不是?

Transformer架構目前是AI領域的參考架構,因其出色的擴充套件性而成為工業標準,但其注意力機制的計算成本高昂。文章探討了Transformer是否會是最終架構,還是隻是第一個真正可擴充套件的架構。

  • Transformer的強項是注意力機制,可處理多種資料型別。
  • 注意力機制計算成本高,隨序列長度擴充套件性差。
站內正文

序列雷達#873:上週AI:足球、S-1和超級模型

一場新的AI足球錦標賽、主要模型釋出、融資活動以及Anthropic的S-1檔案。

  • LayerLens宣佈舉辦Stratix杯,一個模擬足球錦標賽,前沿AI模型將參與其中。
  • 微軟在Build大會上釋出了新的MAI模型,標誌著AI作為作業系統的趨勢。
站內正文

序列觀點第872期:蛋糕是戰場:誰真正控制了AI堆疊

輝達CEO黃仁勳將AI堆疊描繪成一個五層蛋糕,強調和諧共生。但從戰略角度看,這實際上是五個利潤池的垂直戰場,真正的控制權在於掌握稀缺層及其相鄰的接縫。

  • 黃仁勳的AI蛋糕圖景從晶片供應商角度強調了各層相互促進的和諧。
  • 戰略家看到的是五個利潤池的競爭,每層都可能被商品化。
站內正文

AI週報 #871:深入解析Claude Opus 4.8

Claude Opus 4.8於2026年5月28日釋出,雖然版本號僅小幅提升,但在可靠性方面取得了重大進步,包括4倍的校準改進、修復靜默跳過工具呼叫、更好的壓縮恢復支援長期任務、動態工作流、自適應思考以及速度提升2.5倍且價格降低3倍的模式。該版本強調模型在長時間執行中的穩定性和誠實度,而非基準測試分數的提升,使其成為生產環境中代理迴圈的理想基礎設施。

  • Claude Opus 4.8在可靠性方面顯著提升,特別是校準和工具呼叫修復,相比4.7版本錯誤率降低約4倍。
  • 新特性包括動態工作流、自適應思考和快速模式,使得模型在長時間任務中更穩定且成本更低。
站內正文

序列知識 #870:液態模型與後Transformer架構探索

本文探討了Transformer架構的侷限性,以及液態模型作為一種有前景的替代方案,後者更適用於低延遲、隱私保護的端側智慧場景。

  • Transformer架構雖主導AI,但全域性注意力機制導致推理時記憶體和計算成本高昂。
  • 液態模型透過動力學方法替代注意力機制,為即時、低功耗裝置提供可能。
站內正文

The Sequence Radar #869:AI上週要聞:Token成為賬戶單位——Opus 4.8、OpenRouter、Cognition、Snowflake及教皇警告

Anthropic釋出Claude Opus 4.8,接近運營盈利;OpenRouter、Cognition等公司融資規模驚人;Snowflake與AWS簽下60億美元大單;Pope Leo XIV釋出通諭警告AI風險。AI行業正在從以模型為中心的競爭轉向以token為計價單位的商業模式。

  • Anthropic的Claude Opus 4.8在編碼和推理能力上小幅提升,並引入努力控制、動態工作流和誠實度測量。
  • OpenRouter完成1.13億美元融資,周處理量達25萬億token;Cognition融資10億美元,其AI開發者Devin撰寫89%的內部程式碼。
站內正文

序列觀點#868:遞迴是新的擴充套件定律

在AI時代,擴充套件定律曾驅動進步,但現在遞迴——模型或系統自我審視、修正、搜尋和模擬的能力——正在成為新的擴充套件維度。這一轉變標誌著從單次前向傳播到迴圈計算的正規化轉移。

  • 傳統AI進步依賴於更大模型和更多資料,但遞迴正成為新前沿。
  • 遞迴使模型能夠反覆改進答案,而非一次性輸出。
站內正文

AI序列第867期:潛力思考——為什麼Sapient的HRM-Text是對思維鏈的悄然反駁

本文批評了大型語言模型中的思維鏈(CoT)推理方式,認為它效率低下,因為推理過程被迫離開殘差流變成離散的token。Sapient Intelligence的HRM-Text模型透過在潛在空間中進行推理來解決這個問題,為固定深度的Transformer提供可變的內部深度,從而挑戰當前的推理正規化。

  • 思維鏈(CoT)並非真正的推理,而是一種讓模型從輸出token中“租用”深度的變通方法。
  • Sapient Intelligence的HRM-Text將推理放在潛在空間中進行,而非token流中。
站內正文

序列知識 #866:你需要了解的三款文本擴散模型

文本擴散模型挑戰了傳統自迴歸語言生成正規化,將生成過程視為從噪聲或掩碼開始、逐步精煉的編輯過程。文章介紹了該領域的三個關鍵系統:LLaDA(證明擴散可擴充套件為大型語言模型)、Mercury(實現商業速度優勢)和Gemini Diffusion(前沿驗證),它們共同代表了新架構類的三階段:科學證明、工業部署和前沿驗證。

  • 文本擴散模型透過迭代去噪而非逐詞生成文本,利用雙向上下文。
  • LLaDA證明了擴散模型可以擴充套件到真正的大語言模型規模。
站內正文

The Sequence Radar #865:上週AI回顧:Karpathy、Google、Colossus與即將到來的IPO浪潮

上週AI領域迎來重大轉折:Google釋出Gemini Omni及代理優先平臺;Andrej Karpathy加入Anthropic,專注於利用Claude加速預訓練研究;Anthropic與xAI達成價值450億美元的Colossus算力租賃協議;Cerebras IPO成功,市值近950億美元;SpaceX、OpenAI和Anthropic計劃在未來六個月內相繼上市,總估值可能超過3萬億美元。此外,多項前沿研究釋出,包括HRM-Text高效預訓練正規化、AI評審員效果評估、NVIDIA的聯合AR-擴散模型等。

  • Google在I/O大會上推出Gemini Omni多模態模型和代理優先平臺Antigravity,整合TPU 8i實現垂直整合。
  • Andrej Karpathy加入Anthropic,組建團隊利用Claude加速預訓練研究,標誌著自我改進迴圈的實質性進展。
站內正文

《序列觀點》第864期:每個AI代理都需要一臺電腦

AI代理的下一個階段將由對計算機的訪問定義——檔案系統、終端、瀏覽器等,而非僅僅是更好的模型。代理沙箱市場正在興起。

  • AI代理需要真實的執行環境,包括檔案系統、終端、網路等。
  • 僅能生成令牌的代理如同缸中之腦,缺乏行動能力。
站內正文

序列知識第862期:瞭解文本擴散模型

文本擴散模型作為自迴歸Transformer模型在語言生成領域的可信替代方案正在興起,克服了生成漂移和反轉詛咒等侷限。

  • 擴散模型主導視覺AI,但在文本領域長期被忽視。
  • 自迴歸模型存在固有問題:從左到右生成、缺乏全域性規劃、錯誤級聯。
站內正文

序列雷達 #861:上週AI要聞——IPO、互動式模型與遞迴之夢

上週AI領域迎來多個重要事件:Cerebras IPO使其市值飆升至950億美元;Thinking Machines推出將互動能力內建於模型本身的“互動式模型”;前Salesforce首席科學家Richard Socher創立Recursive Superintelligence,致力於透過自動實驗實現AI自我改進;前阿里巴巴Qwen負責人林俊陽以約20億美元估值創辦新AI實驗室。

  • Cerebras IPO首日大漲68%,市值達950億美元,凸顯AI硬體的重要性。
  • Thinking Machines釋出研究預覽版互動式模型,將即時協作作為模型本身的一部分。
站內正文

序列知識 #858:狀態空間模型如何從新奇之物蛻變為Transformer的強勁對手

狀態空間模型(SSM)憑藉線性時間複雜度和恆定記憶體推理,正在挑戰Transformer在序列建模中的主導地位。本文梳理了SSM的數學基礎、發展歷程及其在語言建模等任務上的表現,指出其已逐漸具備與Transformer競爭的能力。

  • Transformer的自注意力機制存在O(n²)的複雜度問題,限制了超長上下文視窗的擴充套件。
  • 狀態空間模型提供線性複雜度、無KV快取,推理時記憶體恆定。
站內正文

序列雷達 #857:上週AI速覽:機器內部,文本框之外

本週AI領域呈現科學化、產品化和投機化並存的趨勢。Anthropic釋出了自然語言自編碼器,實現模型內部狀態的語言化解釋;OpenAI推出新語音模型,推動AI向原生介面演進;SubQ聲稱擁有1200萬token上下文視窗,挑戰現有RAG架構;中國AI實驗室DeepSeek和Moonshot估值飆升,市場將AI公司視為戰略資產。整體而言,AI正從模型競賽轉向基礎設施競賽。

  • Anthropic的自然語言自編碼器將模型啟用壓縮為自然語言,開創了可解釋性的新正規化
  • OpenAI語音模型使AI從文本介面轉向即時語音代理,使用者體驗發生質變
站內正文

The Sequence 本週AI第855期:深入解析Nemotron Omni——NVIDIA為智慧體打造的新多模態大腦

NVIDIA的Nemotron 3 Nano Omni是一款多模態推理模型,將影片、音訊、影像和文本處理統一到單個高效模型中,用於智慧體工作流,避免了分離模型帶來的有損管道。

  • Nemotron 3 Nano Omni將影片、音訊、影像和文本整合到一個模型中。
  • 旨在取代由獨立ASR、VLM和OCR模型組成的碎片化管道。
站內正文

全部來源