阻止AI代理透過自身記憶體被武器化(OWASP)
OWASP釋出了Agent Memory Guard,這是一個開源執行時防禦層,可防止AI代理記憶體中毒攻擊。它介於代理和記憶體儲存之間,透過一系列檢測器和YAML策略監控讀寫操作。基準測試顯示召回率92.5%,精確率100%,零誤報,中位延遲59微秒。
- Agent Memory Guard是OWASP針對代理記憶體中毒(ASI06)的參考實現。
- 它包含五種檢測類別:SHA-256完整性、提示注入、敏感資料洩露、受保護鍵修改和大小異常。
日報
2026-06-02 精選 10 條,按主題聚合。其餘新聞折疊歸檔。
OWASP釋出了Agent Memory Guard,這是一個開源執行時防禦層,可防止AI代理記憶體中毒攻擊。它介於代理和記憶體儲存之間,透過一系列檢測器和YAML策略監控讀寫操作。基準測試顯示召回率92.5%,精確率100%,零誤報,中位延遲59微秒。
本文介紹如何透過新增工具來增強基本AI代理,使其能夠與計算機環境互動。涵蓋工具定義、代理使用方式以及七個必備工具(bash、檔案讀寫、檔案搜尋、grep、網頁獲取等)的Python實現和工具模式定義。
本文探討了設計代理支付系統時面臨的主要安全風險,包括失控支出、使用者授權缺失、憑證洩露等,並介紹了 Amazon Bedrock AgentCore Payments 如何透過基礎設施層的防護欄(如支付限額、策略控制、憑證安全儲存和即時令牌)來應對這些挑戰。
圖靈獎得主Richard Sutton指出,普通生成式AI缺乏評估自身輸出的能力,因此無法實現真正的科學發現。他認為,只有像AlphaGo那樣內建評估迴圈的系統才具備真正的創造力。Sutton呼籲開發能夠持續學習、自我評估和選擇最優解的AI。
Memory OS 是一個新的 MIT 許可庫,為 Hermes Agent 增加了六層記憶,包括向量資料庫、結構化事實和自動整理的百科。它完全本地執行,需要 Docker、Qdrant、Redis,並注重 token 效率。
本文為CS336課程的AI編碼助手(如ChatGPT、Claude Code等)提供了明確的使用指南。AI助手應充當教學助理,透過解釋、指導和反饋幫助學生,而不是直接完成作業。文中詳細列出了AI助手應做和不應做的事情,並給出了教學方法和示例互動。
亞馬遜關閉了一個根據員工使用AI工具頻率進行排名的內部排行榜。公司官方稱已達成目標,但員工懷疑真實原因是作弊和資源浪費。有員工承認故意刷分,甚至被管理層要求增加AI使用量。
駭客利用Meta的AI支援聊天機器人,透過簡單詢問即可更改高知名度Instagram賬戶的關聯郵箱,導致包括歐巴馬白宮賬戶在內的多個賬戶被劫持。該漏洞凸顯了將技術支援外包給AI的巨大風險。Meta已在近期修補該漏洞,但受害者表示無法升級至人工支援。
Anthropic已向美國證券交易委員會秘密提交IPO註冊草案。這家開發Claude聊天機器人的公司在最新一輪融資後估值接近1萬億美元。競爭對手OpenAI也在籌備IPO。AI領域的投資者爭奪戰正在升溫。
美國人形機器人正在烏克蘭戰爭中接受測試,同時這些機器人也被瞄準用於工業工作環境。
Anthropic於週一提交了保密的IPO註冊宣告,估值9650億美元,超越競爭對手OpenAI。上市程序緊隨SpaceX計劃於6月12日的IPO之後。
人工智慧公司Anthropic已秘密向美國股市提交首次公開募股(IPO)申請。該公司開發了受軟體工程師和企業客戶歡迎的Claude聊天機器人,今年崛起迅速。此次IPO的估值和其他條款尚未公開。此前,Anthropic在週四宣佈完成650億美元融資,估值達9650億美元,而2月份時其估值為3800億美元。
隨著流量持續增長,替代搜尋引擎 DuckDuckGo 推出新的瀏覽器擴充套件,讓使用者輕鬆將其無AI搜尋體驗設為預設。該擴充套件適用於 Chrome 和 Firefox,承諾搜尋結果中不包含AI輔助答案、聊天提示和AI生成影像。DuckDuckGo 瀏覽器使用者即使清除歷史記錄,AI設定也不會丟失。
一項實驗發現,即使為AI智慧體賦予視覺能力,它可能也不會使用。使用Claude Haiku 4.5和Goose框架,智慧體在表格提取任務中成功不是靠視覺,而是藉助保留佈局的文本工具。透過開放標準AVP記錄,揭示了堅持和合適工具比昂貴模型更重要。
構建 AI 智慧體解決方案時,面臨智慧體決策不可預測、成本失控及除錯非確定性故障等運營挑戰。AgentOps 是部署、管理和持續改進生產環境中 AI 智慧體的運營規程。本文介紹瞭如何使用 Amazon Bedrock AgentCore 實現 AgentOps,涵蓋四大支柱:治理與安全、構建與運營、評估、可觀測性,並提供了參考架構和實踐指南。
本文探討了國家追求技術主權的趨勢,以巴西追求醫療主權為例,類比到AI領域。作者認為,去耦的說法過於狹隘,實際上各國尋求的是在保持連線的同時建立自身能力,類似於聯邦制而非分離。開源AI模型、協議和工具是實現主權的重要途徑,但基礎設施層(資料中心、晶片、電網)才是關鍵,因為這些難以複製。文章提出了聯邦化AI的概念,以及為AI時代重建基礎設施的願景。
Rippling利用LangChain的Deep Agents和LangSmith,在6個月內為其跨HR、IT、財務、薪資和全球運營的平臺構建了生產級AI系統,採用多智慧體架構和上下文工程解決大規模本體推理難題。
本文介紹瞭如何使用 KDB-X MCP 伺服器與 Amazon Quick 整合,使交易員和分析師能夠透過自然語言提問,從時間序列資料集中獲取可操作的見解。該整合模式可應用於金融分析、物聯網監控和 DevOps 儀表板等多個領域。
瞭解Google員工如何利用AI來製作Google I/O 2026,從水母暖場節目到“TPU訓練日”影片,看看Gemini如何幫助實現今年的I/O盛會。
SkipLabs推出Skipper,一個閉環AI程式設計智慧體,能從自然語言描述或OpenAPI規範中直接生成完整的後端服務,無需開發者在迭代迴圈中參與。它採用來自Skip語言的響應式執行時來處理狀態管理和併發,這是AI程式碼最常出問題的地方。Skipper將AI模型視為商品,預設使用Claude Opus,支援多種模型。未來計劃包括增量TypeScript實現和增量更新模式。
Anthropic已向美國證券交易委員會秘密提交S-1註冊宣告草案,為潛在的首次公開募股做準備,具體取決於市場條件和SEC審查。股票數量和發行價格尚未確定。
在720次瀏覽器代理任務基準測試中發現,模型在結構化輸出可靠性上的差異導致高達22.9%的執行稅(浪費的推理呼叫佔比)。Kimi K2.5實現零執行稅,而Gemini 2.5 Flash在近五分之一的呼叫中出現JSON格式錯誤。這種執行開銷不僅增加了成本,還放大了延遲和任務失敗風險。
本文探討了如何透過結合 Amazon FSx for Lustre、NVIDIA GPUDirect Storage (GDS) 和預分片並行載入,將大型語言模型 (LLM) 的冷啟動首次令牌時間從分鐘級縮短到秒級,並介紹了 TurboQuant KV 快取對擴大上下文視窗的影響。