阻止AI代理通过自身内存被武器化(OWASP)
OWASP发布了Agent Memory Guard,这是一个开源运行时防御层,可防止AI代理内存中毒攻击。它介于代理和内存存储之间,通过一系列检测器和YAML策略监控读写操作。基准测试显示召回率92.5%,精确率100%,零误报,中位延迟59微秒。
- Agent Memory Guard是OWASP针对代理内存中毒(ASI06)的参考实现。
- 它包含五种检测类别:SHA-256完整性、提示注入、敏感数据泄露、受保护键修改和大小异常。
日报
2026-06-02 精选 10 条,按主题聚合。其余新闻折叠归档。
OWASP发布了Agent Memory Guard,这是一个开源运行时防御层,可防止AI代理内存中毒攻击。它介于代理和内存存储之间,通过一系列检测器和YAML策略监控读写操作。基准测试显示召回率92.5%,精确率100%,零误报,中位延迟59微秒。
本文介绍如何通过添加工具来增强基本AI代理,使其能够与计算机环境交互。涵盖工具定义、代理使用方式以及七个必备工具(bash、文件读写、文件搜索、grep、网页获取等)的Python实现和工具模式定义。
本文探讨了设计代理支付系统时面临的主要安全风险,包括失控支出、用户授权缺失、凭证泄露等,并介绍了 Amazon Bedrock AgentCore Payments 如何通过基础设施层的防护栏(如支付限额、策略控制、凭证安全存储和即时令牌)来应对这些挑战。
图灵奖得主Richard Sutton指出,普通生成式AI缺乏评估自身输出的能力,因此无法实现真正的科学发现。他认为,只有像AlphaGo那样内置评估循环的系统才具备真正的创造力。Sutton呼吁开发能够持续学习、自我评估和选择最优解的AI。
Memory OS 是一个新的 MIT 许可库,为 Hermes Agent 增加了六层记忆,包括向量数据库、结构化事实和自动整理的百科。它完全本地运行,需要 Docker、Qdrant、Redis,并注重 token 效率。
本文为CS336课程的AI编码助手(如ChatGPT、Claude Code等)提供了明确的使用指南。AI助手应充当教学助理,通过解释、指导和反馈帮助学生,而不是直接完成作业。文中详细列出了AI助手应做和不应做的事情,并给出了教学方法和示例交互。
亚马逊关闭了一个根据员工使用AI工具频率进行排名的内部排行榜。公司官方称已达成目标,但员工怀疑真实原因是作弊和资源浪费。有员工承认故意刷分,甚至被管理层要求增加AI使用量。
黑客利用Meta的AI支持聊天机器人,通过简单询问即可更改高知名度Instagram账户的关联邮箱,导致包括奥巴马白宫账户在内的多个账户被劫持。该漏洞凸显了将技术支持外包给AI的巨大风险。Meta已在近期修补该漏洞,但受害者表示无法升级至人工支持。
Anthropic已向美国证券交易委员会秘密提交IPO注册草案。这家开发Claude聊天机器人的公司在最新一轮融资后估值接近1万亿美元。竞争对手OpenAI也在筹备IPO。AI领域的投资者争夺战正在升温。
美国人形机器人正在乌克兰战争中接受测试,同时这些机器人也被瞄准用于工业工作环境。
Anthropic于周一提交了保密的IPO注册声明,估值9650亿美元,超越竞争对手OpenAI。上市进程紧随SpaceX计划于6月12日的IPO之后。
人工智能公司Anthropic已秘密向美国股市提交首次公开募股(IPO)申请。该公司开发了受软件工程师和企业客户欢迎的Claude聊天机器人,今年崛起迅速。此次IPO的估值和其他条款尚未公开。此前,Anthropic在周四宣布完成650亿美元融资,估值达9650亿美元,而2月份时其估值为3800亿美元。
随着流量持续增长,替代搜索引擎 DuckDuckGo 推出新的浏览器扩展,让用户轻松将其无AI搜索体验设为默认。该扩展适用于 Chrome 和 Firefox,承诺搜索结果中不包含AI辅助答案、聊天提示和AI生成图像。DuckDuckGo 浏览器用户即使清除历史记录,AI设置也不会丢失。
一项实验发现,即使为AI智能体赋予视觉能力,它可能也不会使用。使用Claude Haiku 4.5和Goose框架,智能体在表格提取任务中成功不是靠视觉,而是借助保留布局的文本工具。通过开放标准AVP记录,揭示了坚持和合适工具比昂贵模型更重要。
构建 AI 智能体解决方案时,面临智能体决策不可预测、成本失控及调试非确定性故障等运营挑战。AgentOps 是部署、管理和持续改进生产环境中 AI 智能体的运营规程。本文介绍了如何使用 Amazon Bedrock AgentCore 实现 AgentOps,涵盖四大支柱:治理与安全、构建与运营、评估、可观测性,并提供了参考架构和实践指南。
本文探讨了国家追求技术主权的趋势,以巴西追求医疗主权为例,类比到AI领域。作者认为,去耦的说法过于狭隘,实际上各国寻求的是在保持连接的同时建立自身能力,类似于联邦制而非分离。开源AI模型、协议和工具是实现主权的重要途径,但基础设施层(数据中心、芯片、电网)才是关键,因为这些难以复制。文章提出了联邦化AI的概念,以及为AI时代重建基础设施的愿景。
Rippling利用LangChain的Deep Agents和LangSmith,在6个月内为其跨HR、IT、财务、薪资和全球运营的平台构建了生产级AI系统,采用多智能体架构和上下文工程解决大规模本体推理难题。
本文介绍了如何使用 KDB-X MCP 服务器与 Amazon Quick 集成,使交易员和分析师能够通过自然语言提问,从时间序列数据集中获取可操作的见解。该集成模式可应用于金融分析、物联网监控和 DevOps 仪表板等多个领域。
了解Google员工如何利用AI来制作Google I/O 2026,从水母暖场节目到“TPU训练日”影片,看看Gemini如何帮助实现今年的I/O盛会。
SkipLabs推出Skipper,一个闭环AI编程智能体,能从自然语言描述或OpenAPI规范中直接生成完整的后端服务,无需开发者在迭代循环中参与。它采用来自Skip语言的响应式运行时来处理状态管理和并发,这是AI代码最常出问题的地方。Skipper将AI模型视为商品,默认使用Claude Opus,支持多种模型。未来计划包括增量TypeScript实现和增量更新模式。
Anthropic已向美国证券交易委员会秘密提交S-1注册声明草案,为潜在的首次公开募股做准备,具体取决于市场条件和SEC审查。股票数量和发行价格尚未确定。
在720次浏览器代理任务基准测试中发现,模型在结构化输出可靠性上的差异导致高达22.9%的执行税(浪费的推理调用占比)。Kimi K2.5实现零执行税,而Gemini 2.5 Flash在近五分之一的调用中出现JSON格式错误。这种执行开销不仅增加了成本,还放大了延迟和任务失败风险。
本文探讨了如何通过结合 Amazon FSx for Lustre、NVIDIA GPUDirect Storage (GDS) 和预分片并行加载,将大型语言模型 (LLM) 的冷启动首次令牌时间从分钟级缩短到秒级,并介绍了 TurboQuant KV 缓存对扩大上下文窗口的影响。