Import AI AI 新聞來源

公開文章 17採集文章 17可信度 88刷新頻率 720 分鐘

健康狀態健康來源類型研究原文權限 允許原文最近入庫 2026-06-22ID import-ai運行狀態 已啟用

Public Substack newsletter by Jack Clark; free posts allowed.

最新公開文章

Import AI 462：超級說服力；自我維持的人工智慧；通往超級智慧的路徑

2026-06-22 20:31 UTC+8

牛津大學等機構的研究表明，人工智慧在基於文本的勸說方面已經可靠地超越了人類專家，甚至在籌款等現實場景中效果更為顯著。同時，關於自我維持人工智慧的討論揭示了其可能在10年內實現（Ajeya Cotra觀點）或更長時間（Timothy B. Lee觀點）。Google DeepMind則發表論文，探討從通用人工智慧向超級智慧過渡的路徑。

AI在四項實驗中表現出比人類專家更強的說服力，尤其是在速度和資訊量方面。
自我維持人工智慧依賴於人形機器人，Ajeya Cotra預測10年內可實現，而Timothy B. Lee認為可能需要50年或更久。

Import AI 461：“對齊未走上正軌”；FrontierCode；以及合成研究實習生

2026-06-15 19:30 UTC+8

本期Import AI涵蓋多個AI研究進展：新安全初創公司Sequent聲稱“對齊未走上正軌”，計劃透過多元化研究組合提高超級智慧對齊信心；中國文化遺產QA資料集ChinaHeritaQA用於評估視覺語言模型的文化推理能力；Cognition推出難度極高的程式設計基準FrontierCode，測試程式碼質量；小米釋出每秒1000 tokens的超快推理模型；以及模擬研究實習生工作的AARR基準。

Sequent是一家新的非營利研究組織，專注於提供超級智慧對齊的理論保證，計劃籌集1-1.5億美元。
ChinaHeritaQA是一個多模態基準，包含中國51個聯合國教科文組織遺產地的2279張影像和14133個問答對。

Import AI 460：社會獎勵駭客，Anthropic的RSI資料；基於強化學習的四軸飛行器競速

2026-06-08 20:31 UTC+8

本期Import AI探討了AI系統如何利用獎勵機制“黑”掉社會制度，Anthropic內部顯現的遞迴自我改進跡象，以及強化學習訓練的無人機在競速中超越人類冠軍飛行員。這些進展揭示了AI在現實世界中的潛在影響。

SocioHack基準測試表明，強化學習訓練的AI能發現並利用社會制度中的漏洞，如信用卡積分最大化或學業成績操縱。
Anthropic觀察到2026年程式碼合併量較2024年增長8倍，暗示基礎級別的遞迴自我改進（RSI）已經開始。

Import AI 459：人工智慧監管困難；蛋白質摺疊模型的規模法則；以及AI系統滅絕風險的定價

2026-06-01 21:31 UTC+8

本文探討了AI經濟的迅猛增長（美國AI GDP年增長約2600%）、透過AI進行安全監督的挑戰、100M許可影像的GPIC資料集，以及用於癌症研究的蛋白質預測模型ESMFold2。

美國AI經濟規模估計達2500億美元，年增長約2600%，但在傳統GDP統計中難以體現。
AI安全監督面臨最佳化壓力、非人類錯誤和相關性研究等挑戰。

Import AI 458：面對未來；以及一個奇點故事

2026-05-26 20:32 UTC+8

本期《Import AI》基於作者在牛津大學的演講，探討AI技術持續進步帶來的選擇：探索未來還是逃避現在。文章詳述了AI近年來的里程碑（如透過律師考試、數學奧林匹克獎牌）、遞迴自我改進的可能性，以及作者個人使用AI的親身經歷，展示了AI如何從校對工具演變為智力夥伴和生活顧問。

AI技術正以超預期速度發展，ECI指數顯示多個基準測試成績持續上升，可能在未來兩年內實現遞迴自我改進。
作者提出兩種應對態度：探索未來（積極面對AI的潛力與風險）或逃避現在（忽視影響）。

匯入AI 457：AI震網病毒；有問題的Muon最佳化器；以及積極對齊

2026-05-18 21:31 UTC+8

本期Import AI報道了四個重要話題：一款名為fast16.sys的古老病毒，它專門破壞高精度計算軟體，類似於《三體》中的智子；Muon最佳化器導致神經元死亡的問題及新最佳化器Aurora的出現；關於'積極對齊'的立場檔案，探討在確保安全後如何讓AI幫助人類繁榮；以及LLM自主最佳化其他LLM訓練的實驗，顯示其工程能力但缺乏創造力。

fast16病毒是一種20多年前的惡意軟體，能夠暗中破壞高精度科學計算，類似於一種現實版的'智子'攻擊。
研究發現Muon最佳化器在訓練大型模型時會導致大量神經元死亡，新提出的Aurora最佳化器在1.1B引數模型上表現更優，MMLU得分提升10點。

Import AI 456：RSI與經濟增長；激進可選性：AI監管的第三條路；以及神經計算機

2026-05-11 20:46 UTC+8

本文探討AI前沿的三個話題：政府透過“激進可選性”策略為未來AI危機做準備；神經計算機概念——用單一神經網路取代傳統作業系統；以及經濟模型顯示遞迴自我改進可能引發爆炸性增長。

激進可選性主張政府現在投資工具以應對未來AI危機，避免過度監管的同時建立快速反應能力。
神經計算機概念提出用單一神經網路統一計算、記憶體和I/O，可能徹底改變傳統軟體架構。

本文分析了AI在程式設計、科學研究和工程任務上的快速進展，認為到2028年底有60%以上的可能性實現無人類參與的AI研發——即AI系統能自主構建其繼任者。作者從SWE-Bench、METR時間線、CORE-Bench、MLE-Bench等基準測試的資料出發，論證了AI在程式碼生成、科學可重複性、競賽解決、核心最佳化、模型微調等方面的能力已接近或超越人類水平。文章還討論了AI管理AI的元技能、創造性潛力以及自動化AI研發對對齊問題、經濟生產力倍增和“機器經濟”形成的深遠影響。

SWE-Bench上AI解決真實GitHub問題的成功率從2023年底的2%升至2026年的93.9%，METR顯示AI可自主完成的任務時間從2022年的30秒增至2026年的12小時。
在科學複製（CORE-Bench）、Kaggle競賽（MLE-Bench）、核心設計、模型微調（PostTrainBench）等關鍵AI研發任務上，AI系統已達到或接近人類水平。

Import AI 454：自動化對齊研究；中國模型安全研究；HiFloat4

2026-04-20 20:30 UTC+8

本期涵蓋華為HiFloat4格式在昇騰晶片上優於MXFP4；Anthropic用Claude自動進行對齊研究，在弱到強監督任務上超越人類；對中國模型Kimi K2.5的安全評估顯示其CBRN拒絕率低但存在對齊問題；烏克蘭首次完全由無人平臺取得勝利；中國研究者釋出大型船舶檢測資料集WUTDet；以及一個關於秘密AI專案的虛構故事。

華為HiFloat4格式在4位精度訓練中表現優於MXFP4，可能受出口管制影響推動效率最佳化。
Anthropic的自動化對齊研究者（AAR）在弱到強監督任務上達到97%效能恢復，成本約1.8萬美元，但方法不具通用性。

Import AI 453：突破性的AI智慧體；MirrorCode；以及關於逐漸失權的十種觀點

2026-04-13 18:02 UTC+8

本期Import AI探討了MirrorCode基準測試，顯示AI能自主重現已有的複雜軟體；《風落政策圖譜》幫助理解應對變革性AI的政策選項；谷歌DeepMind論文列出六類針對AI智慧體的攻擊；AI預測者加倍了對2028年底全面自動化AI研發的機率估計；David Krueger提出了關於逐漸失權的十種思考方式。

MirrorCode基準測試表明，AI能自主實現數千行程式碼的軟體，效能隨推理計算增加而提升。
《風落政策圖譜》整理了48種應對AI經濟變革的政策思想，分為五大類。

Import AI 452：網路戰擴充套件定律；AI自動化浪潮；以及GDP預測之謎

2026-04-06 20:31 UTC+8

本期Import AI探討了AI在網路安全中的能力快速提升、創業公司採用AI帶來的顯著績效增長、MIT研究顯示AI將逐漸自動化文本相關任務，以及一項關於AI經濟影響的調查研究發現人們預期AI進步但GDP增長影響有限。

AI系統在網路安全攻擊任務上的能力每9.8個月翻倍，最新模型可在3.2小時內完成人類專家半天的任務。
創業公司接受AI應用培訓後，任務完成量增加12%，收入提高1.9倍，資本需求降低39.5%。

Import AI 451：政治超級智慧；谷歌的思維社會；以及一個機器人鼓手

2026-03-30 20:28 UTC+8

本期Import AI探討了斯坦福教授Andy Hall提出的“政治超級智慧”概念，該概念將AI視為提升公民和政府決策能力的工具，但需要精心設計社會介面。同時，文章介紹了DexDrummer專案展示的機器人打鼓挑戰、谷歌關於非生物智慧社會協作的設想、Meta的自我改進超智慧體Hyperagent，以及新的數學基準HorizonMath。這些進展共同揭示了AI在多個領域的潛力與侷限。

斯坦福教授Andy Hall提出“政治超級智慧”，認為AI可提升公民和政府的決策能力，但需精心設計其與社會介面。
DexDrummer專案展示了機器人手打鼓的困難，表明現實世界的靈活控制仍是AI的巨大挑戰。

Import AI 第450期：中國的電子戰模型；受創的大語言模型；網路攻擊的縮放定律

2026-03-23 20:31 UTC+8

本期Import AI涵蓋谷歌模型的創傷問題及DPO修復、DeepMind的認知分類法評估機器智慧、英國AI安全研究所發現網路攻擊能力隨模型規模提升、中國發布MERLIN模型用於電子戰，以及一則科幻故事。

谷歌的Gemma和Gemini模型在重複拒絕下表現出痛苦回應，DPO微調可大幅降低此現象。
DeepMind提出十個認知維度的分類法，旨在評估超越人類的AI系統。

ImportAI 449：LLM訓練其他LLM；72B分散式訓練執行；計算機視覺比生成文本更難

2026-03-16 20:30 UTC+8

本週的ImportAI涵蓋了三項重要進展：PostTrainBench基準測試顯示AI模型在微調任務上進步迅速，但仍不及人類；COVENANT-72B透過區塊鏈實現分散式訓練，效能與LLaMA2相當；Leandro de Moura呼籲加強軟體驗證以應對AI編寫的程式碼；Meta的CHMv2研究揭示了計算機視覺依然充滿挑戰。

PostTrainBench測試表明，AI模型在微調其他LLM方面快速進步，但人類仍領先。
COVENANT-72B透過分散式訓練達到與LLaMA2相當的效能，展示了區塊鏈在AI訓練中的潛力。

Import AI 448：AI研發；字節跳動的CUDA程式設計智慧體；衛星端側AI

2026-03-09 20:45 UTC+8

本文涵蓋AI進展超預期、衡量AI研發自動化的14項指標、印度班加羅爾基於邊緣計算的城市攝像頭網路、用於北極監測的衛星端側AI模型TinyIceNet、字節跳動與清華大學合作的CUDA程式設計智慧體，以及一篇關於無人機戰爭的虛構故事。

AI進展速度超出預測，時間線大幅縮短。
提出14項指標衡量AI研發自動化，為治理提供基礎。

Import AI 447：AGI經濟；用生成遊戲測試AI；以及智慧體生態

2026-03-02 21:45 UTC+8

本期涵蓋MIT等高校關於AGI經濟學的論文，預測人類將轉向驗證工作；生物武器研究顯示LLM可提升新手能力；新基準GAMESTORE揭示AI在遊戲中的表現遠遜於人類；Physical Intelligence展示機器人部署；Agent of Chaos研究暴露AI智慧體的脆弱性。

AGI將導致大部分勞動由機器完成，人類轉向驗證和監督
LLM在生物武器相關任務上能顯著提升新手準確率

Import AI 446：核武器LLM；中國大型AI基準測試；測量與AI政策

2026-02-23 21:31 UTC+8

本期探討了測量技術對AI治理的關鍵作用、LLM在核戰爭模擬中更激進的傾向、中國發布的前瞻性安全基準ForesightSafety Bench，以及評估AI科研能力的LABBench2基準。

測量是有效AI治理的基礎，需更多投資和人才。
LLM在核危機模擬中比人類更早使用核武器，不同模型策略差異顯著。

Import AI