AI 日報 2026-06-02

今日必讀

Agent

阻止AI代理通過自身內存被武器化（OWASP）

2026-06-01

OWASP發佈了Agent Memory Guard，這是一個開源運行時防禦層，可防止AI代理內存中毒攻擊。它介於代理和內存存儲之間，通過一系列檢測器和YAML策略監控讀寫操作。基準測試顯示召回率92.5%，精確率100%，零誤報，中位延遲59微秒。

Agent Memory Guard是OWASP針對代理內存中毒（ASI06）的參考實現。
它包含五種檢測類別：SHA-256完整性、提示注入、敏感數據泄露、受保護鍵修改和大小異常。

從頭構建基本AI代理：工具

2026-06-01

本文介紹如何通過添加工具來增強基本AI代理，使其能夠與計算機環境交互。涵蓋工具定義、代理使用方式以及七個必備工具（bash、文件讀寫、文件搜索、grep、網頁獲取等）的Python實現和工具模式定義。

工具是暴露給LLM的函數，使代理能自主執行操作。
現代LLM支持原生工具調用，以JSON格式生成工具請求。

使用 Amazon Bedrock AgentCore Payments 的內置防護欄實現安全的代理支付

2026-06-01

本文探討了設計代理支付系統時面臨的主要安全風險，包括失控支出、用户授權缺失、憑證泄露等，並介紹了 Amazon Bedrock AgentCore Payments 如何通過基礎設施層的防護欄（如支付限額、策略控制、憑證安全存儲和即時令牌）來應對這些挑戰。

AgentCore Payments 讓AI代理能夠代表終端用户支付付費資源，當前與Coinbase和Stripe（Privy）合作提供預覽版。
系統面臨四大風險：失控支出、用户授權不足、開發者密鑰和錢包令牌泄露、支付工具信息暴露。

圖靈獎得主Richard Sutton：純生成式AI無法進行真正的科學發現

2026-06-01

圖靈獎得主Richard Sutton指出，普通生成式AI缺乏評估自身輸出的能力，因此無法實現真正的科學發現。他認為，只有像AlphaGo那樣內置評估循環的系統才具備真正的創造力。Sutton呼籲開發能夠持續學習、自我評估和選擇最優解的AI。

生成式AI只能模仿或隨機生成，無法判斷新想法的好壞。
真正的科學發現需要經歷變化、評估和選擇性保留三個階段。

遇見 Memory OS：基於 Hermes Agent 的六層開源記憶棧

2026-06-01

Memory OS 是一個新的 MIT 許可庫，為 Hermes Agent 增加了六層記憶，包括向量數據庫、結構化事實和自動整理的百科。它完全本地運行，需要 Docker、Qdrant、Redis，並注重 token 效率。

Memory OS 在 Hermes Agent 內置記憶之上增加了六層：工作區、會話、結構化事實、Fabric、向量數據庫和 LLM 百科。
檢索採用基於門控、去重的四源召回，捕獲在調用後自動進行。

斯坦福大學CS336課程AI助手使用指南

2026-06-01

本文為CS336課程的AI編碼助手（如ChatGPT、Claude Code等）提供了明確的使用指南。AI助手應充當教學助理，通過解釋、指導和反饋幫助學生，而不是直接完成作業。文中詳細列出了AI助手應做和不應做的事情，並給出了教學方法和示例交互。

AI助手應充當教學助理，而非解決方案生成器。
禁止編寫代碼、直接給出解決方案或完成作業中的TODO部分。

工具

亞馬遜因員工作弊關閉內部AI使用排行榜

2026-06-01

亞馬遜關閉了一個根據員工使用AI工具頻率進行排名的內部排行榜。公司官方稱已達成目標，但員工懷疑真實原因是作弊和資源浪費。有員工承認故意刷分，甚至被管理層要求增加AI使用量。

亞馬遜關閉內部AI使用排行榜，官方稱已達成目標，但員工懷疑因作弊和浪費
有員工因被批評AI使用不足而作弊刷分

政策

黑客要求Meta AI授予他們Instagram賬户訪問權限，竟然成功了

2026-06-01

黑客利用Meta的AI支持聊天機器人，通過簡單詢問即可更改高知名度Instagram賬户的關聯郵箱，導致包括奧巴馬白宮賬户在內的多個賬户被劫持。該漏洞凸顯了將技術支持外包給AI的巨大風險。Meta已在近期修補該漏洞，但受害者表示無法升級至人工支持。

黑客通過Meta AI聊天機器人，請求更改目標賬户的郵箱地址，成功接管Instagram賬户。
受影響的賬户包括奧巴馬白宮賬户、太空軍首席軍士長賬户和絲芙蘭賬户。

創業融資

Claude製造商Anthropic向SEC秘密提交IPO申請

2026-06-01

Anthropic已向美國證券交易委員會秘密提交IPO註冊草案。這家開發Claude聊天機器人的公司在最新一輪融資後估值接近1萬億美元。競爭對手OpenAI也在籌備IPO。AI領域的投資者爭奪戰正在升温。

Anthropic秘密提交S-1註冊草案，啓動IPO流程
公司估值在最新65億美元融資後接近1萬億美元

機械人

美國人形機器人在烏克蘭戰爭中進行測試

2026-06-01

美國人形機器人正在烏克蘭戰爭中接受測試，同時這些機器人也被瞄準用於工業工作環境。

美國人形機器人在烏克蘭戰爭中進行實戰測試
機器人還計劃應用於工業領域

其餘更新（13 條）

創業融資

Anthropic正式提交上市申請

2026-06-01

Anthropic於週一提交了保密的IPO註冊聲明，估值9650億美元，超越競爭對手OpenAI。上市進程緊隨SpaceX計劃於6月12日的IPO之後。

Anthropic向SEC秘密提交IPO草案，估值9650億美元，成為全球最高估值初創公司。
這一估值超過了主要競爭對手OpenAI的8520億美元。

Anthropic秘密提交美國上市申請

2026-06-01

人工智能公司Anthropic已秘密向美國股市提交首次公開募股（IPO）申請。該公司開發了受軟件工程師和企業客户歡迎的Claude聊天機器人，今年崛起迅速。此次IPO的估值和其他條款尚未公開。此前，Anthropic在週四宣佈完成650億美元融資，估值達9650億美元，而2月份時其估值為3800億美元。

Anthropic秘密提交美股IPO申請
公司未披露估值和發行條款

工具

DuckDuckGo 推出“無AI”搜索擴展，流量激增下強化反AI立場

2026-06-01

隨着流量持續增長，替代搜索引擎 DuckDuckGo 推出新的瀏覽器擴展，讓用户輕鬆將其無AI搜索體驗設為默認。該擴展適用於 Chrome 和 Firefox，承諾搜索結果中不包含AI輔助答案、聊天提示和AI生成圖像。DuckDuckGo 瀏覽器用户即使清除歷史記錄，AI設置也不會丟失。

DuckDuckGo 發佈瀏覽器擴展，可將 noai.duckduckgo.com 設為默認搜索引擎。
擴展強調無AI搜索體驗，不含AI輔助答案或聊天提示。

Agent

我們給AI智能體裝上眼睛，它卻根本沒使用它們

2026-06-01

一項實驗發現，即使為AI智能體賦予視覺能力，它可能也不會使用。使用Claude Haiku 4.5和Goose框架，智能體在表格提取任務中成功不是靠視覺，而是藉助保留佈局的文本工具。通過開放標準AVP記錄，揭示了堅持和合適工具比昂貴模型更重要。

AI智能體裝備視覺能力卻未使用，成功源於佈局感知的文本工具。
便宜模型（Claude Haiku 4.5）在正確工具和框架下完成高難度PDF提取任務。

AgentOps：使用 Amazon Bedrock AgentCore 大規模運營 AI 智能體

2026-06-01

構建 AI 智能體解決方案時，面臨智能體決策不可預測、成本失控及調試非確定性故障等運營挑戰。AgentOps 是部署、管理和持續改進生產環境中 AI 智能體的運營規程。本文介紹瞭如何使用 Amazon Bedrock AgentCore 實現 AgentOps，涵蓋四大支柱：治理與安全、構建與運營、評估、可觀測性，並提供了參考架構和實踐指南。

AgentOps 是專門為 AI 智能體設計的運營規程，應對其自主決策帶來的挑戰。
四大支柱包括治理與安全、構建與運營、評估、可觀測性。

AI主權與參與架構

2026-06-01

本文探討了國家追求技術主權的趨勢，以巴西追求醫療主權為例，類比到AI領域。作者認為，去耦的説法過於狹隘，實際上各國尋求的是在保持連接的同時建立自身能力，類似於聯邦制而非分離。開源AI模型、協議和工具是實現主權的重要途徑，但基礎設施層（數據中心、芯片、電網）才是關鍵，因為這些難以複製。文章提出了聯邦化AI的概念，以及為AI時代重建基礎設施的願景。

巴西追求醫療主權，希望自主生產疫苗和藥物，減少對外依賴。
類似地，各國追求AI主權，旨在不依賴少數美國或中國公司。

Rippling如何在6個月內藉助Deep Agents和LangSmith實現全產品AI化

2026-06-01

Rippling利用LangChain的Deep Agents和LangSmith，在6個月內為其跨HR、IT、財務、薪資和全球運營的平台構建了生產級AI系統，採用多智能體架構和上下文工程解決大規模本體推理難題。

Rippling的AI層使用監督智能體協調5-7個專業子智能體，涵蓋讀取、RAG和操作三類智能體。
上下文工程通過動態技能注入、代碼執行和變量引腳（REPL）減少上下文膨脹100-500倍。

Amazon Quick 通過 MCP 集成時間序列數據庫實現市場情報分析

2026-06-01

本文介紹瞭如何使用 KDB-X MCP 服務器與 Amazon Quick 集成，使交易員和分析師能夠通過自然語言提問，從時間序列數據集中獲取可操作的見解。該集成模式可應用於金融分析、物聯網監控和 DevOps 儀表板等多個領域。

Amazon Quick 集成 MCP 協議，無需複雜數據庫查詢即可訪問時間序列數據。
使用 KDB-X MCP 服務器在 EC2 上部署，並通過 Amazon Bedrock AgentCore Gateway 進行安全連接。

我們如何使用Gemini打造Google I/O 2026

2026-06-01

瞭解Google員工如何利用AI來製作Google I/O 2026，從水母暖場節目到“TPU訓練日”影片，看看Gemini如何幫助實現今年的I/O盛會。

Google I/O 2026的創作過程中廣泛使用了AI工具，包括Gemini、Nano Banana等。
製作團隊將AI與人類藝術結合，創造了短片“TPU訓練日”、視覺品牌形象、沉浸式體驗等。

這個編程智能體不想要你的反饋——它直接交付，無需迭代

2026-06-01

SkipLabs推出Skipper，一個閉環AI編程智能體，能從自然語言描述或OpenAPI規範中直接生成完整的後端服務，無需開發者在迭代循環中參與。它採用來自Skip語言的響應式運行時來處理狀態管理和併發，這是AI代碼最常出問題的地方。Skipper將AI模型視為商品，默認使用Claude Opus，支持多種模型。未來計劃包括增量TypeScript實現和增量更新模式。

Skipper是一個閉環智能體，從描述直接生成可運行的後端服務，無需人工審查和迭代。
它使用Skip語言的響應式運行時自動管理狀態、緩存失效和併發，避免AI代碼在這些方面的常見錯誤。

Anthropic向SEC秘密提交S-1草案

2026-06-01

Anthropic已向美國證券交易委員會秘密提交S-1註冊聲明草案，為潛在的首次公開募股做準備，具體取決於市場條件和SEC審查。股票數量和發行價格尚未確定。

Anthropic於2026年6月1日秘密向SEC提交了S-1草案。
IPO是可選的，需待SEC審查和市場條件。

智能體執行税：大模型在瀏覽器自動化中的真正瓶頸

2026-06-01

在720次瀏覽器代理任務基準測試中發現，模型在結構化輸出可靠性上的差異導致高達22.9%的執行税（浪費的推理調用佔比）。Kimi K2.5實現零執行税，而Gemini 2.5 Flash在近五分之一的調用中出現JSON格式錯誤。這種執行開銷不僅增加了成本，還放大了延遲和任務失敗風險。

智能體執行税衡量因無效結構化輸出而產生的冗餘推理調用比例，Gemini高達22.9%，而Kimi為零。
結構化輸出可靠性是核心瓶頸：Gemini每5次調用就有1次解析失敗，導致87%的任務至少經歷一次重試。

模型

利用 Amazon FSx for Lustre 上的 GPUDirect 和 TurboQuant 加速 LLM 模型加載並擴大上下文窗口

2026-06-01

本文探討了如何通過結合 Amazon FSx for Lustre、NVIDIA GPUDirect Storage (GDS) 和預分片並行加載，將大型語言模型 (LLM) 的冷啓動首次令牌時間從分鐘級縮短到秒級，並介紹了 TurboQuant KV 緩存對擴大上下文窗口的影響。

CPU 模型加載是冷啓動瓶頸，對 405B 參數模型需 10–20 分鐘。
FSx for Lustre + GPUDirect Storage 通過 EFA 直接向 GPU HBM 傳輸數據，繞過 CPU。