AI 日報

今日必讀

政策

SelfAssay：個人生物黑客決策支持平台

2026-07-13 06:00 UTC+8

SelfAssay是一個整合同行評審研究、真實世界報告和知識圖譜的平台，為生物黑客提供基於證據的決策支持，通過交叉驗證和校準信心來評估化合物效果。

平台整合超過114,000項研究和181,000份真實世界報告，提供可追溯的引用來源
通過交叉驗證不同來源的信號，呈現一致性和衝突

AI是新式印刷機（又一個陳詞濫調）

2026-07-13 05:49 UTC+8

作者將人工智能比作印刷機，認為AI並非創造了新的信息生成方式，而是大幅提升了信息生成和重組的效率。通過空氣動力學類比，解釋了AI如何通過規模定律逼近人類智能，並預測AI可能像語言一樣對人類大腦產生深遠的生物學影響。

AI與印刷機一樣，沒有發明信息本身，而是使信息傳播和生成變得極其高效。
AI通過數據、模型和計算規模的擴展來近似人類智能，而非模仿人類思維。

AI會毀掉我的“算法一百天”嗎？

2026-07-13 04:47 UTC+8

八年前，作者開始了“算法一百天”挑戰，通過手寫代碼學習算法。如今回顧，項目存在諸多缺陷，如最大流算法不完整、圖算法錯誤等。作者反思，若當年有AI輔助，可能會促進學習但也可能導致走捷徑。最終決定保留代碼作為歷史記錄，並更新README。

作者八年前啓動“算法一百天”挑戰，手寫實現算法以鞏固學習。
項目經GPT-5.6審核，發現多處實現有缺陷，如最大流存根、BFS行為異常等。

愛思唯爾全球調查：3000名研究人員僅不到一半有足夠時間做研究，但認為AI可帶來變革

2026-07-13 04:38 UTC+8

愛思唯爾發佈《未來研究者》報告，基於對113個國家3200多名研究人員的調查，揭示研究人員面臨時間不足、資金壓力等挑戰，但AI工具採用率從2024年的37%躍升至58%。中國研究人員對AI的信心遠高於美國和英國。同時，研究人員的國際流動意願下降，但跨學科合作增加。

僅45%的研究人員有足夠時間做研究，68%表示發表壓力增大。
AI工具使用率從2024年的37%增至58%，但僅32%認為機構有良好AI治理。

模型

Fable 再次延期可用

2026-07-13 05:20 UTC+8

由於 GPT-5.6 Sol 被明確歸類為 Fable/Mythos 級模型，Anthropic 再次延長了 Claude Max 計劃中 Fable 模型的可用期限至 7 月 19 日。此舉原因為計算資源限制，而 OpenAI 則對 GPT-5.6 的訪問限制顯得更有信心。作者認為 Anthropic 應永久保留 Fable 訪問權限，否則用户會因不確定性而轉向 OpenAI。

Anthropic 將 Claude Fable 5 的訪問延長至 7 月 19 日。
延期原因是計算資源約束，需評估需求與可用性。

Agent

Adaptive Recall：通過MCP為AI助手提供持久記憶

2026-07-13 05:08 UTC+8

Adaptive Recall 是一種為AI助手設計的持久記憶系統，它利用認知科學和機器學習，通過多種檢索策略、認知評分、知識圖譜和自我改進機制，不斷提升記憶檢索質量。

四種並行檢索策略：向量相似性、時間近因、全文關鍵詞、知識圖譜遍歷
基於ACT-R認知科學的評分模型，結合頻率、連接和置信度排序

AI基於人類心理做空低價股

2026-07-13 05:03 UTC+8

Fade Engine是一個完全自主的AI系統，通過識別18種小盤股泡沫模式，在模擬賬户中實時做空並公開每筆交易。系統在交易時段每五分鐘掃描一次，收盤前平倉，所有記錄公開透明。

Fade Engine是一個獨立的AI系統，用於識別並做空過度拉伸的小盤股
系統在模擬的10,000美元賬户上實時交易，所有交易公開

AI輔助研究的SETI家園

2026-07-13 04:45 UTC+8

本文提出將AI用户未使用的推理代幣眾籌用於科學研究，類比於SETI@home項目。討論了小型團隊利用AI解決數學問題的成功案例，以及眾籌推理能力所需的設計挑戰。

SETI@home曾利用家用電腦閒置算力分析外星信號。
如今，AI用户可將未使用的token配額貢獻給集體研究。

研究

Show HN：AI主觀評估，AI打造的街機遊戲

2026-07-13 05:01 UTC+8

一個AI街機基準測試項目，讓多個編碼模型在相同限制下獨立創作遊戲，由玩家評判趣味性。

項目設置192×144像素、6鍵的街機平台，要求AI模型一次性生成可玩遊戲。
參與模型包括Grok 4.5、GPT-5.6-sol、Fable 5等，遊戲如Catacomb、Sky Shards、Forge。

工具

Lorde 稱 Ray-Ban Meta AI 眼鏡“不性感”

2026-07-13 04:10 UTC+8

歌手 Lorde 在馬德里的 Real Cool 音樂節上公開反對 AI 眼鏡，疑似針對贊助商 Ray-Ban 與 Meta 合作的智能眼鏡。她表示很難辨別真實與虛幻，並直言“去他媽的眼鏡，不性感”。

Lorde 在音樂節表演中批評 AI 眼鏡，疑似指向 Ray-Ban Meta 智能眼鏡。
她認為這些眼鏡讓人難以區分真實與虛假，並明確表示反對。

其餘更新（17 條）

Agent

循環工程指南：'自動研究'和'雙層自動研究'如何將AI代理轉變為自主機器學習ML研究循環

2026-07-13 04:07 UTC+8

本文介紹了循環工程的概念，即AI代理自主迭代實現目標，包含驗證器、狀態和停止條件三個關鍵部分。詳細闡述了安德烈·卡帕西的自動研究循環和雙層自動研究，展示了具體成果：自動研究在700次實驗中找到20個改進，使GPT-2訓練速度提升11%；雙層自動研究通過外層元循環進一步實現了5倍的性能提升。還提供了可複用的構建塊和實際操作模板。

循環工程用自主循環取代手動提示，循環包含驗證器、狀態和停止條件。
卡帕西的自動研究循環一夜運行700次實驗，獲得20個改進，訓練速度提升11%。

AI的記憶。在你的機器上，由你掌控。

2026-07-13 03:44 UTC+8

exxperts 是一個本地優先的智能體運行時，提供持久的 AI 房間，帶有受管控的、需審批的記憶功能。所有內容都在本地運行，數據以文件形式存儲在你的磁盤上，確保隱私和控制權。它提供 Web 應用和 CLI/TUI 兩種界面。

exxperts 提供持久 AI 房間，記憶寫入需用户審批，用户完全控制 AI 的記憶。
所有數據都存儲在本地，位於 ~/.exxperts 目錄下，無遙測數據。

Kote：從AI聊天和Git中捕捉並重用工程上下文的開源工具

2026-07-13 02:56 UTC+8

Kote 是一款開源工具，自動捕捉開發者與 AI 助手的對話、Git 提交記錄以及開發上下文，構建可搜索的知識庫，幫助開發者快速回憶過去的技術決策和解決方案。支持 VS Code 擴展、GitHub 集成、CLI、瀏覽器擴展、WhatsApp/Telegram 消息集成等，可自託管部署。

Kote 被動捕捉 AI 會話、Git 活動等上下文，自動組織成知識庫。
支持 VS Code CodeLens 顯示文件相關筆記，提供 AI 摘要和時間線。

一步陷阱（人工智能研究中的常見錯誤）

2026-07-13 02:41 UTC+8

在人工智能研究中，一步陷阱是指錯誤地認為所有或大多數學習到的預測可以是一步預測，而長期預測可以通過迭代一步預測得到。雖然這種想法吸引人，但由於誤差累積和計算複雜性問題，在實踐中往往效果不佳。本文分析了這一陷阱及其危害，並提出了使用時間抽象模型（如選項和GVF）的解決方案。

一步預測的微小誤差會在迭代過程中累積，導致長期預測嚴重失真。
在隨機環境中，長期預測的計算複雜度隨預測長度呈指數增長，難以實現。

反對實用性

2026-07-13 01:47 UTC+8

本文探討了“無用”研究對未來創新的重要性。作者以Folk Computer系統為例，追溯了從施樂帕克到動態地的研究脈絡，並呼籲資助那些尚未顯現實用價值的範式級工作。

Folk Computer是一個開源物理計算系統，讓整個房間成為計算機。
該系統源自艾倫·凱、佈雷特·維克多等人的研究傳統。

OpenAI的AI在AtCoder世界巡迴賽決賽中擊敗所有人類選手

2026-07-13 00:54 UTC+8

OpenAI的AI系統在AtCoder世界巡迴賽2026算法組中解出全部五道題，得分8300分，而人類最高分僅4300分。啓發式組中，AI得分是人類最佳成績的七倍以上。60萬日元的“人類勝出獎”無人領取。該系統被比作即將發佈的GPT-5.6。

OpenAI的AI解出所有五道算法題，得8300分，人類最高4300分
無人解出最難的C題和E題

芯片

AI客户逐漸認同“小而美”的理念

2026-07-13 03:53 UTC+8

OpenAI和Anthropic致力於構建大型通用模型，但微軟等公司正轉向開發小型專用模型，以降低成本並提高效率。微軟的MAI模型家族正在取代OpenAI的模型，用於其產品中的AI功能。

微軟開發了MAI系列小型專用模型，正在取代OpenAI的通用模型。
小型模型在特定任務上更高效、更經濟，可部署多個實例。

Windows 11 Copilot 告訴你什麼拖慢了電腦，而它自己卻佔用1GB內存

2026-07-13 01:45 UTC+8

微軟正在測試Copilot的“PC Insights”功能，可以分析系統資源使用情況，幫助用户找出性能瓶頸。然而，Copilot本身是一個完整的Web應用，附帶私人版Edge，空閒時佔用高達1GB內存，凸顯了其資源消耗的諷刺性。該功能為可選，默認不自動掃描，用户需授予權限。

Copilot新增“PC Insights”功能，可讀取CPU、內存、存儲等系統信息並回答相關問題。
功能為可選，需用户授權，不會在後台自動掃描。

蘋果失敗的自動駕駛汽車項目留下了強大的AI芯片遺產

2026-07-13 00:27 UTC+8

蘋果的自動駕駛汽車項目雖未成功，但其對AI處理的需求催生了神經網絡引擎。該引擎首次亮相於iPhone X的A11仿生芯片，現已成為蘋果設備端AI處理的核心，並延續至M系列芯片。未來，蘋果將加速M7芯片開發，其神經網絡引擎大幅升級，M7 Ultra服務器芯片將支持高達1.5TB內存。

蘋果汽車項目促使神經網絡引擎誕生，成為設備端AI處理基石。
神經網絡引擎伴隨A11仿生芯片首次用於iPhone X的人臉識別等功能。

模型

AI模型協同設計：硬件友好的LLM設計

2026-07-13 03:35 UTC+8

AI性能取決於準確性、吞吐量和交互性三個維度。本文聚焦吞吐量和交互性，探討模型設計選擇如何在不犧牲準確性的情況下優化兩者，旨在推動帕累託前沿向外擴展。

AI性能的三個維度：準確性、吞吐量、交互性。
部署必須平衡三者，高準確性若響應慢則無意義。

GPT-5.6、Fable 5和Grok 4.5根據同一規格重建Basecamp

2026-07-13 01:02 UTC+8

作者通過Basecamp基準測試評估了GPT-5.6 Sol、Fable 5、Grok 4.5等AI模型在構建前端和後端方面的表現。Fable 5在兩個賽道上均獲勝，Grok 4.5在速度和成本之間取得了最佳平衡。結果顯示，即使是頂級模型在完成度上也有顯著差異，尤其是最後10%的打磨工作。

Fable 5在前端和後端基準測試中均得分最高，接近真實Basecamp實現。
Grok 4.5以9.30美元的成本在37分鐘內完成構建，速度成本比最優。

政策

開源模型只剩下6個月的生命？

2026-07-13 02:50 UTC+8

當前開源AI面臨着最嚴峻的生存考驗。白宮正討論通過行政命令限制開源模型，特別是針對中國模型和政府用途。同時，蒸餾和前沿能力的政策討論正在同時進行，可能導致在未來6個月內禁止或推遲開源模型。文章批評了Anthropic的監管捕獲行為，認為蒸餾問題的解決方案實際上有利於推動者。API並不比開源模型更安全，而全面禁止開源模型並非良策。開源社區需要團結一致，積極遊説，確保安全部署。