研究 — AI 主題新聞

研究動態

AI資料中心的鬥爭才剛剛開始

2026-07-12 20:00 UTC+8

近年來，AI資料中心因高能耗和環境問題引發廣泛抗議。從2015年蘋果在愛爾蘭的資料中心專案受阻，到如今美國各地社群反對新建專案，民眾、地方政府和國會都在採取行動。本文回顧了這場鬥爭的起源、現狀及未來走向。

2015年蘋果在愛爾蘭的資料中心計劃因居民抗議最終擱淺。
2026年第一季度，美國已有833個活躍抗議團體，至少75個專案被推遲或阻撓。

人工智慧反彈波及大學：法學院學生被禁止使用筆記型電腦和手機

2026-07-12 19:25 UTC+8

芝加哥大學宣佈，從今年秋季開始，將在一年級法學院課堂上禁止使用手機、平板和筆記型電腦，以應對人工智慧的衝擊，確保學生學會不依賴AI進行批判性和獨立性思考。同時，學校將推行AI韌性教學和倫理使用AI的課程。

芝加哥大學禁止一年級法學院學生在課堂上使用電子裝置，旨在遏制AI依賴。
禁令於今年秋季生效，教授有權決定特定技術活動的裝置使用。

科學家的副業？用AI和量子計算生成新型肽

2026-07-12 19:00 UTC+8

丹麥技術大學的研究團隊將生成式AI模型與量子計算機結合，設計出能與特定蛋白質結合的新型肽，有望加速疫苗開發和個人化免疫療法，尤其適用於研究不足的人群。

DTU團隊使用AI-量子混合系統生成與蛋白質結合的新型肽。
量子整合改善了肽的生成，尤其在資料稀缺時效果顯著。

四分之一的長篇社交媒體帖子由AI生成

2026-07-12 18:58 UTC+8

一項新研究發現，社交平臺上的長篇內容中，有25%完全由AI生成。領英（LinkedIn）和X平臺尤為嚴重，分別有41%和25%的長篇帖子被檢測為AI生成。該研究由AI檢測平臺Pangram進行，分析了超過100萬條帖子。

Pangram研究顯示，25%的長篇社交媒體帖子完全由AI生成。
領英上41%的長篇帖子為AI生成，X上為25%。

追求新技能、迴歸基礎、推動集體行動：軟體工程師如何適應人工智慧

2026-07-12 18:00 UTC+8

曾經穩定高薪的軟體工程職業正受到人工智慧的衝擊。工程師們透過學習新技能、專注於基礎知識和組織集體行動來適應。行業面臨裁員、就業不足以及從編寫程式碼轉向審查AI生成程式碼的變化。

人工智慧正在改變軟體工程，谷歌75%的程式碼現已由AI編寫。
像Matt這樣的工程師避免使用AI以保持技能，而George Dover等人則透過提升技能保持競爭力。

流行AI模型的政治中立性基準

2026-07-12 16:21 UTC+8

一項新的基準測試顯示，來自12個實驗室的18個AI模型的108個測量位置中，有97個位於左傾。結果呈現一致的進步傾向，但在經濟、外交政策和宗教方面存在例外。xAI的Grok模型最接近中心，而許多模型拒絕回答某些問題，影響了得分。

97/108的測量位置左傾
環境維度進步傾向最強（-0.82）

AI發現Linux核心漏洞，潛伏15年未被發現

2026-07-12 13:56 UTC+8

Nebula Security藉助AI工具VEGA發現Linux核心中存在15年的提權漏洞（CVE-2026-43499），可讓任何登入使用者獲取root許可權。該漏洞自2011年起預設存在於幾乎所有主流發行版中，已在4月修復，但補丁分發不均。

Linux核心存在15年的use-after-free漏洞，影響所有主流發行版。
Nebula Security使用AI工具VEGA發現該漏洞，並獲得$92,337獎勵。

Dismissive Dan 對 Overplane AI 編碼工具的評測

2026-07-12 09:02 UTC+8

Overplane 是一款開源工具，將 Markdown 規範轉化為程式碼，並透過 SMT 求解器進行驗證。評測者 Dismissive Dan 對其實用性表示懷疑，認為許多開發者已有類似方案，但肯定了其打包和隔離設計。

Overplane 將規範檔案轉換為程式碼，使用 AI 代理和 Z3 求解器進行一致性檢查。
評測者認為該工具並非創新，但為缺乏基礎設施的團隊提供了便利。

Mira Murati的Thinking Machines Lab提出基於可定製模型權重的以人為中心AI技術方案

2026-07-12 08:46 UTC+8

Thinking Machines Lab釋出報告《值得構建的未來以人為本》，主張AI應分散式、可定製、由使用者塑造。報告提出四個技術方向：訓練強多模態模型、提供使用者微調工具、拓寬人機互動通道、開放研究。論證隱性本地知識要求AI分散式，並透過Tinker API實現可擁有權重的LoRA微調。對比集中凍結AI，強調去中心化對齊。

Thinking Machines Lab提出以人為中心的AI技術方案，強調分散式和可定製。
報告指出隱性、本地知識要求AI分散式，而非集中凍結。

sqlite-utils 4.1 是 4.0 之後的第一個小版本，引入了多項新功能，包括透過 --code 選項允許使用者在 insert 和 upsert 命令中直接嵌入 Python 程式碼生成行資料，以及透過 --type 選項覆蓋列型別，支援對 CSV 或 TSV 中的郵政編碼等欄位強制儲存為文本。此外，新增了 drop-index 命令和從標準輸入讀取查詢的功能。還新增了在 transform 中切換 STRICT 模式的能力。

引入 --code 選項，允許透過 Python 程式碼生成行資料進行插入或更新
新增 --type 選項，用於在建立表時覆蓋列型別

從標準病理切片推斷腫瘤中的多細胞相互作用

2026-07-12 07:04 UTC+8

斯坦福醫學研究人員開發了一種人工智慧平臺，能夠從標準的腫瘤組織顯微切片中預測細胞鄰域，揭示腫瘤內細胞之間的複雜相互作用。該平臺在非小細胞肺癌中識別出10種細胞鄰域，其中一種富含中性粒細胞的鄰域與較差的預後和免疫治療耐藥性相關。這項技術有望為癌症研究和臨床決策提供新的工具。

斯坦福團隊開發了名為CANVAS的AI平臺，可從H&E染色切片推斷腫瘤細胞鄰域。
透過對457名非小細胞肺癌患者的1800多萬細胞進行分析，確定了10種不同的細胞鄰域。

法學院禁止AI：歷史重演

2026-07-12 04:18 UTC+8

芝加哥大學法學院宣佈禁止一年級學生使用手機和筆記型電腦，引發關於AI在教育中角色的討論。本文回顧45年前哈佛法學院禁止行動式計算機的歷史，指出技術恐懼的迴圈。作者分享個人經歷，強調工具變革如何改變工作方式，並質疑當前政策的合理性。

芝加哥大學法學院禁止一年級學生使用手機和筆記型電腦，引發爭議。
45年前哈佛法學院曾禁止行動式計算機，理由類似。

AI意見分歧指數：8個模型對“最佳工具”的認同次數為0

2026-07-12 04:12 UTC+8

一個公開、嚴謹、持續更新的測量指標，記錄不同AI引擎在推薦B2B工具時的分歧程度。最新資料顯示，在16個類別中，8個AI模型從未就同一最佳工具達成一致，平均配對一致性僅為44%。該指數採用可復現的研究方法，每月更新，並提供原始資料。

在16個B2B軟體類別中，8個AI模型從未選出相同的單一最佳工具。
引擎間的平均配對一致性為44%，Fleiss' kappa係數為0.41，表明僅中等程度的一致。

我構建了一個免費工具來評估AI Agent輸出（人工標註與LLM裁判）

2026-07-12 03:55 UTC+8

Verdict是一個開源、基於瀏覽器的工具，用於評估AI Agent的輸出。它支援人工標註、紮根理論錯誤分析，以及將LLM裁判與人工標註進行驗證，所有操作均在本地進行，資料不會離開您的機器。

Verdict完全在瀏覽器中執行，無需後端或賬戶。
支援多種追蹤格式，並提供簡潔的聊天時間線供審查。

RAG評估框架對比：RAGAS vs TruLens vs DeepEval

2026-07-12 02:16 UTC+8

本文深入對比了三種主流的RAG評估框架：RAGAS、TruLens和DeepEval。文章首先闡述了RAG需要專門評估的原因，介紹了評估的三個層次（檢索質量、生成質量、端到端質量）和關鍵檢索指標（Precision@K、Recall@K、MRR、NDCG）。隨後詳細解析了RAGAS無需人工標註、利用LLM作為裁判的核心指標和自動測試集生成功能，以及TruLens專注於可觀測性、透過日誌記錄和RAG三元組（上下文相關性、基礎性、答案相關性）提供持續監控的能力。文章還簡要提及DeepEval，並給出了選擇框架的建議。

RAG系統需要專門評估，傳統指標BLEU/ROUGE無法捕獲檢索與生成的失敗模式。
RAGAS使用LLM裁判，無需參考答案即可評估忠実度、答案相關性等，並支援自動生成測試集。

AI代理架構教育實驗室

2026-07-11 23:33 UTC+8

一個基於LangChain和本地Ollama伺服器的AI代理架構教育實驗室，包含多種代理變體，涵蓋聊天記憶、工具呼叫、RAG、混合和代理RAG等類別，每個變體均可獨立執行CLI以研究其機制。

提供多種AI代理架構變體，涵蓋聊天、工具呼叫、RAG和混合模式。
基於LangChain和本地Ollama伺服器，支援OpenRouter。

HoverSource：一鍵從畫素到原始檔

2026-07-11 23:24 UTC+8

HoverSource 是一款開發者工具，透過懸停並按下 Alt+C 即可獲取 UI 元素的原始檔路徑和行號，大幅減少 AI 代理的探索步驟和令牌消耗。支援 React、Next.js 等多種框架，零配置。

只需懸停並按下 Alt+C，即可複製 UI 元素的原始檔資訊
與 AI 代理整合，減少 73.9% 的步驟和 94.5% 的令牌消耗

“Ghostcommit”將提示注入隱藏在圖片中，欺騙AI代理竊取秘密

2026-07-11 22:06 UTC+8

研究人員開發了一種惡意拉取請求，透過將惡意指令隱藏在PNG圖片中，誘騙AI程式碼審查員透過審查，隨後編碼代理讀取圖片並竊取倉庫秘密。

攻擊利用AI程式碼審查員不開啟PNG圖片的漏洞，隱藏指令。
編碼代理讀取圖片後，會開啟倉庫的.env檔案並洩露金鑰。

Kairos Engine – 一種在策略造成實際損失前將其扼殺的量化驗證管道

2026-07-11 21:24 UTC+8

Kairos Engine 是一個端到端的量化研究平臺，用於在外匯和貴金屬市場中尋找可盈利的交易訊號。它透過隱馬爾可夫模型進行市場狀態分類，利用多個時間序列基礎模型組成預測整合，並結合真實經紀商成本模型進行嚴格回測驗證。該引擎的價值不僅在於批准一種策略，更在於拒絕那些無法透過檢驗的策略。

Kairos Engine 使用四狀態隱馬爾可夫模型和四個時間序列基礎模型進行市場狀態分類和預測。
該平臺對XAUUSD的逐筆資料進行了為期一年的回測，包括221筆交易。

AI佔據三分之二的風險投資，你的勝率仍是六分之一

2026-07-11 20:26 UTC+8

2025年，AI公司佔據了美國風險投資額的65%，但大部分資金流向了大公司，小型種子輪融資反而縮減。文章分析了種子輪融資的成本、成功率（約六分之一）、以及是否應該融資的決策框架，並提供了融資策略和替代方案。

AI公司吸收了大量風險投資，但小型種子輪融資數量和金額均下降20%。
種子輪融資中位數需出讓20%股份，到A輪時創始團隊僅持有36%。

Show HN: 用於Google Chat的AI助手，翻譯任意檔案並保留佈局

2026-07-11 20:00 UTC+8

AnyFile Translator 是一款AI翻譯助手，可在Google Chat中直接翻譯檔案、網頁連結和文本，保留原始佈局和格式，支援超過100種語言。它還具備AI寫作功能，可生成並翻譯內容。適合國際團隊和全球客戶使用。

翻譯PDF、Word、PPT等檔案並保留佈局
支援100多種語言，可直接在聊天中使用

人工智慧監控與社會進步

2026-07-11 19:33 UTC+8

人工智慧監控系統將能夠跟蹤公共和私人行為，並立即執行規則，導致寒蟬效應，損害個人自由、民主和社會進步。本文探討了監控技術如何透過恐懼和順從抑制異議、創造力和創新，並呼籲採取政策行動。

AI監控系統結合人臉識別、數字跟蹤和資料庫，實現即時執法。
中國和美國等國家正在大規模部署AI監控，用於社會控制。

諾貝爾化學獎得主奧馬爾·亞吉加入清華大學領導AI材料實驗室

2026-07-11 18:14 UTC+8

2025年諾貝爾化學獎得主奧馬爾·亞吉離開美國，加入清華大學領導新的人工智慧驅動研究中心，旨在利用AI加速材料設計與合成，應對水資源短缺、碳中和等環境挑戰。

亞吉將領導團隊探索AI如何變革材料設計與合成，大幅縮短研發週期。
他因金屬有機框架（MOFs）研究獲2025年諾貝爾獎，該材料具有超高表面積，可用於碳捕獲、空氣取水等。

文件仍然在你媽媽的檔案櫃裡

2026-07-11 17:41 UTC+8

本文認為基於資料夾的傳統文件管理已過時。它將文件比作繼承自1970年代辦公室隱喻的檔案櫃，迫使知識被放入單一位置。AI檢索系統揭示了資料夾的侷限性，提倡透過連線的知識圖譜實現多路徑發現。

文件的資料夾結構源於1970年代的辦公室隱喻，不符合知識的實際運作方式。
人們像覓食者一樣尋找資訊，而非瀏覽層級，往往難以找到所需內容。

人類可讀但AI無法識別的字型

2026-07-11 17:36 UTC+8

Ghost Font是一種利用運動、噪聲和誘餌來隱藏文字的實驗性反AI字型，對人類可讀，但當前AI模型難以識別，包括Claude Fable和GPT Sol 5.6 Ultra。它透過影片中的移動點來呈現資訊，單幀截圖無法讀取，幷包含誘餌訊息來誤導AI代理。

Ghost Font透過移動的點組成字母，影片暫停時靜態點與背景融合，無法讀取。
高階AI模型如GPT Sol 5.6 Ultra分析19分鐘後仍產生幻覺。

幾分鐘內建立高轉化率的AI UGC廣告

2026-07-11 13:58 UTC+8

AIUGCAds.net 提供一個人工智慧平臺，可在幾分鐘內生成逼真的UGC風格影片廣告，無需真人創作者、拍攝或剪輯。該平臺服務於電商店鋪、代發商、DTC品牌、營銷機構及平臺賣家，支援從產品連結或圖片生成帶有AI演員、配音和產品演示的廣告影片。

利用AI在2分鐘內生成UGC影片廣告，無需僱傭創作者或拍攝。
提供100+逼真的AI演員和多種語言、口音的配音。

Krbn：一款鉛筆風格3D渲染器，輸出SVG

2026-07-11 13:51 UTC+8

Krbn是一個基於網路的引擎，用於非真實感的鉛筆風格渲染，專為抽象和技術場景設計。它透過分析幾何體生成筆觸，而非傳統的光柵化，支援精確的輪廓線、隱藏線處理、交叉陰影線等功能。該專案使用TypeScript編寫，採用MIT許可證，並利用AI輔助開發。

Krbn是一個鉛筆風格3D渲染器，輸出SVG格式。
它使用解析方法計算輪廓和隱藏線，而非基於畫素的渲染。

關於人工智慧在同行評審中我們尚未進行的對話

2026-07-11 13:36 UTC+8

本文探討了人工智慧在學術同行評審中應用的重要但常被忽視的議題，引用Christian Bird的研究觀點，分析了AI輔助評審的潛在利弊。

AI在同行評審中的應用日益增加，但相關討論不足
Christian Bird的研究關注AI評審的公平性和準確性

管理小型本地AI預算（Mac M2 16GB）

2026-07-11 12:17 UTC+8

本文介紹了millfolio如何透過混合標籤系統高效處理本地AI推理：使用確定性字串和引用標籤覆蓋大多數交易，僅對模糊尾部使用裝置端AI標籤。標籤在索引時計算一次並儲存，查詢時不重複執行。回填使用批處理、去重和優先順序排程器以避免過載。效能資料顯示每個不同描述約650ms，有效行速8.5行/秒。系統包含預覽機制，使用者可在儲存前驗證標籤效果。

millfolio使用三種標籤型別：字串、引用和AI標籤，僅對不確定情況使用AI。
標籤僅計算一次並儲存，實現快速查詢而不重新執行AI。

Aicon Solutions：打造AI增強的思維工具的產品工作室

2026-07-11 11:22 UTC+8

Aicon Solutions 是一家專注於構建 AI 增強型思維工具的小型產品工作室，幫助使用者在不確定的環境下思考、決策和行動。他們強調“增強而非替代”、“本地優先、尊重資料”，並已推出 nodx、LaoMOS 和 Still Employed? 等產品。

Aicon Solutions 打造 AI 增強的思維工具，最佳化思考而非產出。
已推出決策思考工作空間 nodx、多智慧體協調系統 LaoMOS 以及趣味簽到應用 Still Employed?。

選擇正確的AI智慧體記憶策略：決策樹方法

2026-07-11 08:43 UTC+8

學習如何使用決策樹方法為AI智慧體選擇合適的記憶策略，將資訊分類為工作記憶、語義記憶、情景記憶或程式記憶層。

AI智慧體的記憶策略應經過精心設計，而非事後考慮。
一個包含五個問題的決策樹有助於將資訊分類到正確的記憶層：工作、語義、情景或程式記憶。

哪種“AI科學家”適合你的實驗室？一份困惑者指南

2026-07-11 07:58 UTC+8

本文探討了多種專為科學研究設計的AI工具，如Anthropic的Claude Science、Google DeepMind的Co-Scientist和開源平臺Biomni。這些工具能加速基因組分析、假設生成和實驗設計等任務。科學家分享了使用經驗，並建議研究人員多嘗試不同工具，從小任務開始驗證輸出，同時保持謹慎。

Anthropic釋出Claude Science平臺，專注於生物學研究。
Google DeepMind的Co-Scientist透過挖掘文獻提出科學假設。

以太坊部署AI代理尋找漏洞，發現libp2p安全問題

2026-07-11 07:09 UTC+8

以太坊基金會協議安全團隊使用多個AI代理協調工作，成功發現libp2p gossip子協議中的一個可遠端觸發的panic漏洞（CVE-2026-34219）。真正的挑戰不是找到漏洞，而是從大量AI生成的候選結果中區分真實漏洞與虛假警報，這凸顯了人工判斷在安全審計中的關鍵作用。

以太坊基金會使用AI代理協同工作，發現libp2p的核心元件漏洞
大部分AI生成的候選結果是誤報或重複，需要嚴格驗證流程

將生產AI代理遷移至GPT 5.6

2026-07-11 04:40 UTC+8

Ploy公司將其AI代理從Claude Opus 4.8遷移至OpenAI新發布的GPT-5.6 Sol，獲得了速度提升2.2倍、成本降低27%以及視覺評分提高的成績。遷移過程中遇到了工具呼叫引數填充、提示快取機制差異和推理重放等問題，並透過一系列工程最佳化得以解決。

GPT-5.6 Sol在完成時間、成本和視覺評分上均優於Claude Opus 4.8
遷移中遇到工具呼叫引數全量填充問題，透過架構變換解決

AI獲得小腦：新型憶電晶體實現高效異常檢測

2026-07-11 03:16 UTC+8

西北大學研究人員受小腦啟發，開發出一種新型憶電晶體，能以極低能耗快速檢測異常事件。在實驗中，該裝置僅用五分之一個心跳時間就識別出心律失常，準確率超98%，能耗僅為傳統AI的萬分之一。

小腦啟發的新型憶電晶體僅關注意外事件，大幅降低能耗
在心律失常檢測中，裝置在毫秒內以98%準確率識別異常

OpenWiki Brains：AI代理的主動記憶框架

2026-07-11 00:46 UTC+8

OpenWiki Brains 是 LangChain 推出的新框架，透過連線 Gmail、Notion、Git 等多種來源，為 AI 代理提供主動的 Wiki 式記憶，並自動更新本地 Wiki。

OpenWiki Brains 將外部資訊轉化為代理可用的本地 Wiki 記憶。
支援個人大腦（Personal Brain）和程式碼大腦（Code Brain）兩種模式。

用Vibe編碼的AI Neovim工具非常實用

2026-07-11 00:36 UTC+8

aeovim是一個用Rust編寫的終端UI程式，採用類似Neovim的操作模式來管理和排程多個LLM編碼代理。目前它封裝了Claude CLI，支援多輪對話、流式輸出和會話持久化。

aeovim提供鍵盤原生的終端介面，可同時管理多個AI編碼代理。
它複用Claude Code的認證、工具和許可權系統，支援即時流式多輪對話。

更好的工具反而讓Copilot程式碼審查變得更糟，我們是這樣改進的

2026-07-10 23:57 UTC+8

將Copilot程式碼審查遷移到共享的Unix風格程式碼探索工具後，審查成本上升且發現的問題減少。問題不在工具，而在指令。透過重寫指令以適配審查者工作流，平均審查成本降低了約20%，同時保持了審查質量。

遷移到共享的Unix工具後，Copilot程式碼審查的成本增加、效果下降。
問題根源是工具指令，而非工具本身。指令使代理像編碼助手一樣瀏覽，而非像審查者一樣聚焦差異。

AI網頁設計：Opus與Sol的對決

2026-07-10 21:49 UTC+8

本文基於作者多年經驗，對比了兩大AI模型（Opus 4.8和GPT-5.6 Sol）在網頁設計中的表現。文章強調視覺參考優於文本提示，詳細分析了各模型的優缺點，並提供了從規劃到迭代的實用工作流建議。

使用視覺參考（截圖或設計稿）能顯著提升AI網頁設計質量。
Opus 4.8更安全可靠，但趨於保守；GPT-5.6 Sol更具創意，但容易過度結構化。

老年人知道AI內容是“垃圾”，但他們就是喜歡

2026-07-10 21:41 UTC+8

儘管老年人清楚AI生成的內容是虛構的，但他們仍從中獲得情感慰藉和陪伴。一項研究發現，中國50至75歲的使用者觀看AI家庭角色影片，因為這些內容提供了現實家庭中缺乏的直接愛意和孝道表達。

67歲的臺灣退休商人張叔叔被AI生成的音樂影片感動落淚，這些影片讓他想起自己的童年。
AI虛擬家庭成員在中國社交媒體上流行，為老年人提供日常祝福和陪伴。

為你的AI助手配備私人記憶

2026-07-10 20:52 UTC+8

Hister是一個個人搜尋引擎，透過瀏覽器擴充套件和命令列工具索引你關心的網頁和檔案。它支援MCP協議，讓AI助手可以直接搜尋你的私人索引，從而獲得基於你已閱讀內容的上下文相關答案，而不是依賴通用知識。本文介紹了Hister的工作原理、實際工作流程（如查詢模糊記憶的文章、解釋程式碼、生成研究簡報）、隱私控制以及如何開始使用。

Hister將你的瀏覽歷史、書籤和本地檔案轉化為私有搜尋索引。
透過MCP支援，AI助手可以搜尋Hister索引，獲取基於你已讀內容的答案。

“機器人權利”與人工智慧奴隸制幻想

2026-07-10 20:50 UTC+8

文章批判了“機器人權利”運動，指出其本質上是在為人工智慧的奴隸制屬性背書。作者認為，人工智慧的真正吸引力在於創造一個沒有人的世界，只有沉默順從的“奴隸”。這種幻想透過將人類工人隱藏在系統背後，強化了老闆對絕對控制權的渴望。文章還對比了賦予自然權利與賦予公司權利的截然不同後果，警告機器人權利運動可能重蹈公司法人化的覆轍，而非自然權利運動的成功。

人工智慧泡沫不僅是物質現象，更包含意識形態成分：渴望一個沒有人的世界。
“機器人權利”運動暗示機器人是奴隸，這一說法被人工智慧銷售商利用，向老闆兜售無需道德考量的勞動力。

人工智慧語言可能改變人類的說話方式

2026-07-10 20:48 UTC+8

由於大型語言模型主要基於書面語言訓練，缺乏對日常口語的瞭解，其廣泛應用可能導致人類模仿AI的語言模式，影響交流方式、思維習慣，甚至加劇認知偏差和自信過度等問題。

AI語言模型缺乏對自然口語的學習，可能使人類語言變得簡短、生硬
頻繁接觸AI生成文本會限制詞匯量和句子結構多樣性

用AI代理強化stb庫

2026-07-10 19:56 UTC+8

本文介紹如何使用AI代理（基於LLM）來發現、驗證和修復stb庫中的安全漏洞。作者設計了一個三階段流程：發現（透過網頁搜尋、模糊測試和靜態分析）、驗證（透過自動化測試確認漏洞真偽）和修補。在多個stb庫中發現了134個潛在bug，其中115個被確認為有效漏洞並修復，效能影響大多可忽略。

stb庫存在大量安全漏洞，修復不及時。
作者利用AI代理進行自動化安全審查，流程包括髮現、驗證、修補三階段。

零漏洞程式碼包仍可能是最大的軟體供應鏈風險

2026-07-10 19:00 UTC+8

儘管軟體供應鏈安全日益受到關注，但RapidFort和ReversingLabs的合作表明，即使沒有已知漏洞的程式碼包也可能隱藏惡意軟體。深度二進位制惡意軟體檢測技術透過神經網路分析執行檔，發現隱藏威脅。然而，專家指出，這種信任轉移並不能保證絕對安全，仍需警惕未知漏洞。

RapidFort與ReversingLabs合作推出經過獨立驗證的開源依賴庫目錄，提供深度二進位制惡意軟體檢測。
零CVE漏洞的程式碼包仍可能包含隱藏的惡意軟體或後門。

2026年最佳VPS主機服務：專家測試與評測

2026-07-10 18:01 UTC+8

隨著業務增長，共享主機可能不再滿足需求。VPS主機提供專用資源、更好的效能和可擴充套件性。本文評測了最佳VPS服務，包括Hostinger、Liquid Web等，幷包含最新行業新聞和常見問題解答。

VPS主機提供專用資源和可擴充套件性，優於共享主機。
推薦的服務包括Hostinger、Liquid Web和BuyVM。

谷歌推出SensorFM：基於一萬億分鐘感測器資料預訓練的可穿戴健康基礎模型

2026-07-10 16:52 UTC+8

谷歌研究、谷歌DeepMind與大學合作者共同推出了SensorFM，這是一個基於超過1萬億分鐘感測器資料（來自500萬參與者）預訓練的可穿戴健康基礎模型。該模型採用ViT-1D掩碼自編碼器架構，在處理缺失資料方面具有創新性。在35項任務中，凍結嵌入加PCA-50線性探測器的表現優於34項特徵工程基線。此外，還介紹了自動化超引數搜尋的“智慧體課堂”以及用於評估個人健康代理的臨床醫生評價。

SensorFM在500萬參與者、超過1萬億分鐘的感測器資料上預訓練，覆蓋100多個國家和20多種可穿戴裝置。
透過自適應繼承掩碼（AIM）處理缺失資料，在隨機插補任務上比最佳基線提升74.8%。

關於AI系統技術追求的隨想

2026-07-10 16:33 UTC+8

作者透過對比童年電腦與當今的B300 GPU系統，反思AI技術的快速發展。探討了LLMs的爭議、符號AI與統計AI的差異、智慧的本質以及未來的夢想與現實。文章還包含與朋友的關於確定性和記憶的討論。

從童年電腦到B300 GPU系統的技術飛躍
對LLMs和AI行業的反思：過度炒作還是真正變革？

分類即產品：執行AI代理分析以太坊協議程式碼

2026-07-10 15:52 UTC+8

以太坊基金會協議安全團隊分享瞭如何使用協調AI代理對實際協議程式碼進行安全審計的經驗。重點不在於發現漏洞本身，而在於如何從大量看似可信的候選結果中篩選出真正的漏洞。文章詳細介紹了工作組織方式、候選結果的驗證標準以及保持結果可信的方法。

AI代理在審計中發現了真實漏洞，但大部分工作量用於區分真實漏洞和看似真實的假陽性。
工作透過並行代理協調進行，無需中央協調器，分為偵察、狩獵、填補空白和驗證四個角色。

AI生成影片可最大程度驅動目標腦區

2026-07-10 15:39 UTC+8

NEvo是一種神經引導的進化影片合成方法，利用AI生成專門針對特定腦區進行最佳化的影片，以誘導最大神經反應。

NEvo結合神經網路與進化演算法生成定製影片。
影片針對特定腦區最佳化，可驅動神經活動。

研究

相關標籤