AI 日報

今日必讀

工具

克里斯托弗·諾蘭稱人們‘鄙視’AI，認為AI取代人類是‘胡說八道’

2026-07-13 08:56 UTC+8

克里斯托弗·諾蘭在與《奧德賽》相關的採訪中表示，許多人“鄙視”人工智慧，並認為AI取代人類的想法是“胡說八道”。他相信自己的大製作實景電影能抵禦AI影響，同時駁斥了右翼對露皮塔·尼永奧飾演海倫的批評，稱其“無關緊要”。

諾蘭稱許多人鄙視AI，AI取代人類是胡說八道。
他相信大製作實景電影能經受AI衝擊。

Agent

Show HN：Clark——擁有自己電腦的AI助手

2026-07-13 08:53 UTC+8

Clark是一個由單人開發的AI助手，旨在與Manus代理在功能和能力上匹敵。它能使用計算機、瀏覽器，進行深度研究，並與谷歌工具整合。已有數千人日常使用。

Clark是一款AI助手，能夠像人類一樣操作計算機和瀏覽器。
它支援深度研究（Clark呼叫Clark）和谷歌工具整合。

OneDev AI：將AI作為團隊成員融入問題、拉取請求和CI

2026-07-13 07:44 UTC+8

OneDev 將 AI 使用者嵌入到開發平臺中，使其能夠像團隊成員一樣處理問題、提交拉取請求、參與程式碼審查以及響應 CI/CD 失敗。這種整合方式保持了需求、實現和審查在同一平臺中可見，提高了透明度和問責性。

AI 使用者可以直接在 OneDev 中處理分配的問題、建立拉取請求並根據反饋進行迭代。
問題作為唯一真實來源，包含需求、附件和討論，AI 據此工作。

AI代理初創公司使用自己的AI代理主導1億美元融資

2026-07-13 07:15 UTC+8

總部位於新澤西州澤西城的初創公司Lyzr利用其AI代理系統SivaClaw成功完成了1億美元的B輪融資。該系統處理了130多名投資者的提問，起草了投資備忘錄，並跟蹤了投資者對簡報的關注點，從而證明了產品的實用性。

Lyzr使用其AI代理SivaClaw完成了1億美元的B輪融資。
SivaClaw處理了130多名投資者的提問並起草了投資備忘錄。

ArgoCD AI助手

2026-07-13 07:00 UTC+8

一個Argo CD UI擴充套件，在資源檢視中新增AI助手選項卡，允許使用者用自然語言查詢Kubernetes資源，並附加上下文（清單、事件、可選日誌）。相容任何OpenAI相容後端，需要Argo CD v2.13+。

作為Argo CD UI擴充套件，提供對Kubernetes資源的自然語言查詢。
透過即時資源清單、事件和可選的容器日誌豐富查詢。

模型

NeuroVFM：基於Vol-JEPA在未經整理的臨床MRI和CT掃描上訓練的新型神經影像基礎模型

2026-07-13 08:35 UTC+8

密歇根大學研究團隊推出NeuroVFM，一種基於524萬臨床MRI和CT體積訓練的通用神經影像基礎模型。其Vol-JEPA方法將自監督學習擴充套件到體積醫學影像，無需放射報告標籤即可學習大腦解剖和病理。在156項診斷任務中達到92.68（CT）和92.49（MRI）的AUROC，並支援報告生成、分診和跨模態遷移。

NeuroVFM在566,915項研究的524萬體積上訓練，覆蓋二十年的臨床資料。
Vol-JEPA採用前景聚焦掩碼的潛在預測，無需重建畫素或依賴報告。

直接負責人（DRI）

2026-07-13 07:57 UTC+8

本文探討了“直接負責人（DRI）”的概念，該術語源自蘋果公司，指對專案成敗最終負責的人。作者認為，隨著LLM驅動的智慧體融入組織，它們永遠不應被視為專案的DRI，因為只有人類才能承擔責任，而機器不能。文章還引用了IBM 1979年的培訓幻燈片，其中指出計算機永遠不能承擔責任，因此絕不能做出管理決策。

DRI概念源自蘋果，GitLab手冊給出了最佳定義。
人類可以對行動負責，而機器不能。

Grok 4.6和GPT5.6在發現PR安全漏洞方面擊敗Anthropic

2026-07-13 06:57 UTC+8

最新基準測試顯示，GPT-5.6 Sol在拉取請求（PR）安全審查中表現最佳，實現100%召回率和0.91的F1分數，每次PR成本僅0.70美元。Anthropic的模型（如Fable 5）未能進入前沿表現，且成本更高。Grok 4.5和Gemini 3.1 Flash Lite提供了經濟高效的替代方案。測試使用私有合成倉庫以避免資料汙染。

GPT-5.6 Sol以0.91 F1和100%召回率領先，成本僅為每次PR 0.70美元。
Anthropic模型未達到前沿，Fable 5效能較差且成本高達約3.61美元/PR。

研究

AI最大的解鎖不是生產力，而是獲取專業知識的途徑

2026-07-13 07:49 UTC+8

本文探討人工智慧如何透過提供個性化輔導和互動學習，縮小教育差距，使更多人獲得專業知識。研究表明，AI在適當設計下能顯著提升學習效果，尤其是對教育背景較弱的人群。

AI將資訊轉化為互動，使個性化學習成為可能。
研究顯示AI能縮小教育差距，如奈及利亞實驗中學到的效果。

AI輔助開發的代價：認知疲勞

2026-07-13 07:05 UTC+8

AI輔助開發帶來了顯著的效率提升，但也引發了新的認知疲勞。程式設計師從解決實現細節的疲勞，轉變為持續進行高層次架構設計決策的疲勞。文章討論了AI工具如何改變程式設計的認知負荷，包括快速遇到設計瓶頸、程式碼審查中的盲點、以及需要建立新的工作習慣來適應這種變化。

AI開發效率提升，但導致決策疲勞和認知負擔增加。
程式設計瓶頸從“能否實現”轉向“是否該實現以及如何實現”。

其餘更新（29 條）

Agent

Show HN：面向AI代理和團隊的協作上下文記憶平臺

2026-07-13 06:28 UTC+8

xysq.ai是一個協作記憶平臺，為AI原生團隊和企業構建。它連線多種AI工具和應用程式，從團隊工作流中捕獲上下文，構建動態知識圖譜，並在AI代理需要時提供正確的上下文。支援團隊記憶隔離、基於角色的訪問、文件組織，並承諾不將使用者資料用於訓練。

xysq.ai作為AI代理和團隊的協作記憶層，連線Slack、Gmail、GitHub等工具。
捕獲事件、流程和語義三種記憶型別，構建動態知識圖譜。

Adaptive Recall：透過MCP為AI助手提供持久記憶

2026-07-13 05:08 UTC+8

Adaptive Recall 是一種為AI助手設計的持久記憶系統，它利用認知科學和機器學習，透過多種檢索策略、認知評分、知識圖譜和自我改進機制，不斷提升記憶檢索質量。

四種並行檢索策略：向量相似性、時間近因、全文關鍵詞、知識圖譜遍歷
基於ACT-R認知科學的評分模型，結合頻率、連線和置信度排序

AI基於人類心理做空低價股

2026-07-13 05:03 UTC+8

Fade Engine是一個完全自主的AI系統，透過識別18種小盤股泡沫模式，在模擬賬戶中即時做空並公開每筆交易。系統在交易時段每五分鐘掃描一次，收盤前平倉，所有記錄公開透明。

Fade Engine是一個獨立的AI系統，用於識別並做空過度拉伸的小盤股
系統在模擬的10,000美元賬戶上即時交易，所有交易公開

AI輔助研究的SETI家園

2026-07-13 04:45 UTC+8

本文提出將AI使用者未使用的推理代幣眾籌用於科學研究，類比於SETI@home專案。討論了小型團隊利用AI解決數學問題的成功案例，以及眾籌推理能力所需的設計挑戰。

SETI@home曾利用家用電腦閒置算力分析外星訊號。
如今，AI使用者可將未使用的token配額貢獻給集體研究。

迴圈工程指南：'自動研究'和'雙層自動研究'如何將AI代理轉變為自主機器學習ML研究迴圈

2026-07-13 04:07 UTC+8

本文介紹了迴圈工程的概念，即AI代理自主迭代實現目標，包含驗證器、狀態和停止條件三個關鍵部分。詳細闡述了安德烈·卡帕西的自動研究迴圈和雙層自動研究，展示了具體成果：自動研究在700次實驗中找到20個改進，使GPT-2訓練速度提升11%；雙層自動研究透過外層元迴圈進一步實現了5倍的效能提升。還提供了可複用的構建塊和實際操作模板。

迴圈工程用自主迴圈取代手動提示，迴圈包含驗證器、狀態和停止條件。
卡帕西的自動研究迴圈一夜執行700次實驗，獲得20個改進，訓練速度提升11%。

AI的記憶。在你的機器上，由你掌控。

2026-07-13 03:44 UTC+8

exxperts 是一個本地優先的智慧體執行時，提供持久的 AI 房間，帶有受管控的、需審批的記憶功能。所有內容都在本地執行，資料以檔案形式儲存在你的磁碟上，確保隱私和控制權。它提供 Web 應用和 CLI/TUI 兩種介面。

exxperts 提供持久 AI 房間，記憶寫入需使用者審批，使用者完全控制 AI 的記憶。
所有資料都儲存在本地，位於 ~/.exxperts 目錄下，無遙測資料。

Kote：從AI聊天和Git中捕捉並重用工程上下文的開源工具

2026-07-13 02:56 UTC+8

Kote 是一款開源工具，自動捕捉開發者與 AI 助手的對話、Git 提交記錄以及開發上下文，構建可搜尋的知識庫，幫助開發者快速回憶過去的技術決策和解決方案。支援 VS Code 擴充套件、GitHub 整合、CLI、瀏覽器擴充套件、WhatsApp/Telegram 訊息整合等，可自託管部署。

Kote 被動捕捉 AI 會話、Git 活動等上下文，自動組織成知識庫。
支援 VS Code CodeLens 顯示檔案相關筆記，提供 AI 摘要和時間線。

一步陷阱（人工智慧研究中的常見錯誤）

2026-07-13 02:41 UTC+8

在人工智慧研究中，一步陷阱是指錯誤地認為所有或大多數學習到的預測可以是一步預測，而長期預測可以透過迭代一步預測得到。雖然這種想法吸引人，但由於誤差累積和計算複雜性問題，在實踐中往往效果不佳。本文分析了這一陷阱及其危害，並提出了使用時間抽象模型（如選項和GVF）的解決方案。

一步預測的微小誤差會在迭代過程中累積，導致長期預測嚴重失真。
在隨機環境中，長期預測的計算複雜度隨預測長度呈指數增長，難以實現。

反對實用性

2026-07-13 01:47 UTC+8

本文探討了“無用”研究對未來創新的重要性。作者以Folk Computer系統為例，追溯了從施樂帕克到動態地的研究脈絡，並呼籲資助那些尚未顯現實用價值的正規化級工作。

Folk Computer是一個開源物理計算系統，讓整個房間成為計算機。
該系統源自艾倫·凱、佈雷特·維克多等人的研究傳統。

OpenAI的AI在AtCoder世界巡迴賽決賽中擊敗所有人類選手

2026-07-13 00:54 UTC+8

OpenAI的AI系統在AtCoder世界巡迴賽2026演算法組中解出全部五道題，得分8300分，而人類最高分僅4300分。啟發式組中，AI得分是人類最佳成績的七倍以上。60萬日元的“人類勝出獎”無人領取。該系統被比作即將釋出的GPT-5.6。

OpenAI的AI解出所有五道演算法題，得8300分，人類最高4300分
無人解出最難的C題和E題

政策

您現在可以在Chatbrat上建立和與AI媽媽聊天

2026-07-13 06:26 UTC+8

Chatbrat.ai 提供免費、安全的AI媽媽聊天機器人，無需下載或註冊。使用者可以建立自定義角色，擁有持久記憶和個性化性格，適用於聊天、角色扮演和遊戲場景。文章介紹了功能、優勢及與同類產品的對比，並強調其作為情感陪伴而非替代真實親人的定位。

Chatbrat.ai 提供免費、無需註冊的AI媽媽聊天機器人，支援在瀏覽器中直接使用。
使用者可以自定義角色的性格、記憶和對話方式，打造專屬的AI媽媽。

SelfAssay：個人生物駭客決策支援平臺

2026-07-13 06:00 UTC+8

SelfAssay是一個整合同行評審研究、真實世界報告和知識圖譜的平臺，為生物駭客提供基於證據的決策支援，透過交叉驗證和校準信心來評估化合物效果。

平臺整合超過114,000項研究和181,000份真實世界報告，提供可追溯的引用來源
透過交叉驗證不同來源的訊號，呈現一致性和衝突

AI是新式印刷機（又一個陳詞濫調）

2026-07-13 05:49 UTC+8

作者將人工智慧比作印刷機，認為AI並非創造了新的資訊生成方式，而是大幅提升了資訊生成和重組的效率。透過空氣動力學類比，解釋了AI如何透過規模定律逼近人類智慧，並預測AI可能像語言一樣對人類大腦產生深遠的生物學影響。

AI與印刷機一樣，沒有發明資訊本身，而是使資訊傳播和生成變得極其高效。
AI透過資料、模型和計算規模的擴充套件來近似人類智慧，而非模仿人類思維。

AI會毀掉我的“演算法一百天”嗎？

2026-07-13 04:47 UTC+8

八年前，作者開始了“演算法一百天”挑戰，透過手寫程式碼學習演算法。如今回顧，專案存在諸多缺陷，如最大流演算法不完整、圖演算法錯誤等。作者反思，若當年有AI輔助，可能會促進學習但也可能導致走捷徑。最終決定保留程式碼作為歷史記錄，並更新README。

作者八年前啟動“演算法一百天”挑戰，手寫實現演算法以鞏固學習。
專案經GPT-5.6稽核，發現多處實現有缺陷，如最大流存根、BFS行為異常等。

愛思唯爾全球調查：3000名研究人員僅不到一半有足夠時間做研究，但認為AI可帶來變革

2026-07-13 04:38 UTC+8

愛思唯爾釋出《未來研究者》報告，基於對113個國家3200多名研究人員的調查，揭示研究人員面臨時間不足、資金壓力等挑戰，但AI工具採用率從2024年的37%躍升至58%。中國研究人員對AI的信心遠高於美國和英國。同時，研究人員的國際流動意願下降，但跨學科合作增加。

僅45%的研究人員有足夠時間做研究，68%表示發表壓力增大。
AI工具使用率從2024年的37%增至58%，但僅32%認為機構有良好AI治理。

開源模型只剩下6個月的生命？

2026-07-13 02:50 UTC+8

當前開源AI面臨著最嚴峻的生存考驗。白宮正討論透過行政命令限制開源模型，特別是針對中國模型和政府用途。同時，蒸餾和前沿能力的政策討論正在同時進行，可能導致在未來6個月內禁止或推遲開源模型。文章批評了Anthropic的監管捕獲行為，認為蒸餾問題的解決方案實際上有利於推動者。API並不比開源模型更安全，而全面禁止開源模型並非良策。開源社群需要團結一致，積極遊說，確保安全部署。

白宮討論透過行政命令限制開源模型，可能在未來6個月內禁止或推遲達到GPT-5.5或Claude Opus 4.8能力水平的開源模型。
蒸餾爭論本質上是監管捕獲，Anthropic藉此推動有利於自己的政策，而非真正解決安全問題。

利用AI讓歷史講述銀行擠兌的故事

2026-07-13 00:40 UTC+8

研究人員編制了1863-1934年間超過3000次銀行擠兌的資料庫，發現大多數擠兌並未導致銀行倒閉，並分析了時空模式。

大多數銀行擠兌並未導致倒閉。
銀行擠兌在1873、1893、1907和大蕭條等重大危機期間激增。

三星強制使用者分享健康資料訓練AI，否則無法正常使用

2026-07-13 00:01 UTC+8

三星健康應用新增AI訓練資料共享要求，使用者若不授權則無法同步健康資料，可能導致手錶功能受限。

三星健康應用要求使用者同意使用個人健康資料訓練AI模型，否則無法同步資料。
資料包括活動、健康記錄、藥物和月經週期，可能有人工審查。

模型

Fable 再次延期可用

2026-07-13 05:20 UTC+8

由於 GPT-5.6 Sol 被明確歸類為 Fable/Mythos 級模型，Anthropic 再次延長了 Claude Max 計劃中 Fable 模型的可用期限至 7 月 19 日。此舉原因為計算資源限制，而 OpenAI 則對 GPT-5.6 的訪問限制顯得更有信心。作者認為 Anthropic 應永久保留 Fable 訪問許可權，否則使用者會因不確定性而轉向 OpenAI。