阻止AI代理通過自身內存被武器化(OWASP)
OWASP發佈了Agent Memory Guard,這是一個開源運行時防禦層,可防止AI代理內存中毒攻擊。它介於代理和內存存儲之間,通過一系列檢測器和YAML策略監控讀寫操作。基準測試顯示召回率92.5%,精確率100%,零誤報,中位延遲59微秒。
- Agent Memory Guard是OWASP針對代理內存中毒(ASI06)的參考實現。
- 它包含五種檢測類別:SHA-256完整性、提示注入、敏感數據泄露、受保護鍵修改和大小異常。
日報
2026-06-02 精選 10 條,按主題聚合。其餘新聞摺疊歸檔。
OWASP發佈了Agent Memory Guard,這是一個開源運行時防禦層,可防止AI代理內存中毒攻擊。它介於代理和內存存儲之間,通過一系列檢測器和YAML策略監控讀寫操作。基準測試顯示召回率92.5%,精確率100%,零誤報,中位延遲59微秒。
本文介紹如何通過添加工具來增強基本AI代理,使其能夠與計算機環境交互。涵蓋工具定義、代理使用方式以及七個必備工具(bash、文件讀寫、文件搜索、grep、網頁獲取等)的Python實現和工具模式定義。
本文探討了設計代理支付系統時面臨的主要安全風險,包括失控支出、用户授權缺失、憑證泄露等,並介紹了 Amazon Bedrock AgentCore Payments 如何通過基礎設施層的防護欄(如支付限額、策略控制、憑證安全存儲和即時令牌)來應對這些挑戰。
圖靈獎得主Richard Sutton指出,普通生成式AI缺乏評估自身輸出的能力,因此無法實現真正的科學發現。他認為,只有像AlphaGo那樣內置評估循環的系統才具備真正的創造力。Sutton呼籲開發能夠持續學習、自我評估和選擇最優解的AI。
Memory OS 是一個新的 MIT 許可庫,為 Hermes Agent 增加了六層記憶,包括向量數據庫、結構化事實和自動整理的百科。它完全本地運行,需要 Docker、Qdrant、Redis,並注重 token 效率。
本文為CS336課程的AI編碼助手(如ChatGPT、Claude Code等)提供了明確的使用指南。AI助手應充當教學助理,通過解釋、指導和反饋幫助學生,而不是直接完成作業。文中詳細列出了AI助手應做和不應做的事情,並給出了教學方法和示例交互。
亞馬遜關閉了一個根據員工使用AI工具頻率進行排名的內部排行榜。公司官方稱已達成目標,但員工懷疑真實原因是作弊和資源浪費。有員工承認故意刷分,甚至被管理層要求增加AI使用量。
黑客利用Meta的AI支持聊天機器人,通過簡單詢問即可更改高知名度Instagram賬户的關聯郵箱,導致包括奧巴馬白宮賬户在內的多個賬户被劫持。該漏洞凸顯了將技術支持外包給AI的巨大風險。Meta已在近期修補該漏洞,但受害者表示無法升級至人工支持。
Anthropic已向美國證券交易委員會秘密提交IPO註冊草案。這家開發Claude聊天機器人的公司在最新一輪融資後估值接近1萬億美元。競爭對手OpenAI也在籌備IPO。AI領域的投資者爭奪戰正在升温。
美國人形機器人正在烏克蘭戰爭中接受測試,同時這些機器人也被瞄準用於工業工作環境。
Anthropic於週一提交了保密的IPO註冊聲明,估值9650億美元,超越競爭對手OpenAI。上市進程緊隨SpaceX計劃於6月12日的IPO之後。
人工智能公司Anthropic已秘密向美國股市提交首次公開募股(IPO)申請。該公司開發了受軟件工程師和企業客户歡迎的Claude聊天機器人,今年崛起迅速。此次IPO的估值和其他條款尚未公開。此前,Anthropic在週四宣佈完成650億美元融資,估值達9650億美元,而2月份時其估值為3800億美元。
隨着流量持續增長,替代搜索引擎 DuckDuckGo 推出新的瀏覽器擴展,讓用户輕鬆將其無AI搜索體驗設為默認。該擴展適用於 Chrome 和 Firefox,承諾搜索結果中不包含AI輔助答案、聊天提示和AI生成圖像。DuckDuckGo 瀏覽器用户即使清除歷史記錄,AI設置也不會丟失。
一項實驗發現,即使為AI智能體賦予視覺能力,它可能也不會使用。使用Claude Haiku 4.5和Goose框架,智能體在表格提取任務中成功不是靠視覺,而是藉助保留佈局的文本工具。通過開放標準AVP記錄,揭示了堅持和合適工具比昂貴模型更重要。
構建 AI 智能體解決方案時,面臨智能體決策不可預測、成本失控及調試非確定性故障等運營挑戰。AgentOps 是部署、管理和持續改進生產環境中 AI 智能體的運營規程。本文介紹瞭如何使用 Amazon Bedrock AgentCore 實現 AgentOps,涵蓋四大支柱:治理與安全、構建與運營、評估、可觀測性,並提供了參考架構和實踐指南。
本文探討了國家追求技術主權的趨勢,以巴西追求醫療主權為例,類比到AI領域。作者認為,去耦的説法過於狹隘,實際上各國尋求的是在保持連接的同時建立自身能力,類似於聯邦制而非分離。開源AI模型、協議和工具是實現主權的重要途徑,但基礎設施層(數據中心、芯片、電網)才是關鍵,因為這些難以複製。文章提出了聯邦化AI的概念,以及為AI時代重建基礎設施的願景。
Rippling利用LangChain的Deep Agents和LangSmith,在6個月內為其跨HR、IT、財務、薪資和全球運營的平台構建了生產級AI系統,採用多智能體架構和上下文工程解決大規模本體推理難題。
本文介紹瞭如何使用 KDB-X MCP 服務器與 Amazon Quick 集成,使交易員和分析師能夠通過自然語言提問,從時間序列數據集中獲取可操作的見解。該集成模式可應用於金融分析、物聯網監控和 DevOps 儀表板等多個領域。
瞭解Google員工如何利用AI來製作Google I/O 2026,從水母暖場節目到“TPU訓練日”影片,看看Gemini如何幫助實現今年的I/O盛會。
SkipLabs推出Skipper,一個閉環AI編程智能體,能從自然語言描述或OpenAPI規範中直接生成完整的後端服務,無需開發者在迭代循環中參與。它採用來自Skip語言的響應式運行時來處理狀態管理和併發,這是AI代碼最常出問題的地方。Skipper將AI模型視為商品,默認使用Claude Opus,支持多種模型。未來計劃包括增量TypeScript實現和增量更新模式。
Anthropic已向美國證券交易委員會秘密提交S-1註冊聲明草案,為潛在的首次公開募股做準備,具體取決於市場條件和SEC審查。股票數量和發行價格尚未確定。
在720次瀏覽器代理任務基準測試中發現,模型在結構化輸出可靠性上的差異導致高達22.9%的執行税(浪費的推理調用佔比)。Kimi K2.5實現零執行税,而Gemini 2.5 Flash在近五分之一的調用中出現JSON格式錯誤。這種執行開銷不僅增加了成本,還放大了延遲和任務失敗風險。
本文探討了如何通過結合 Amazon FSx for Lustre、NVIDIA GPUDirect Storage (GDS) 和預分片並行加載,將大型語言模型 (LLM) 的冷啓動首次令牌時間從分鐘級縮短到秒級,並介紹了 TurboQuant KV 緩存對擴大上下文窗口的影響。