AI 日报 2026-06-25

今日必读

Agent

如何设计一个OpenHarness风格的智能体运行时：包含工具、记忆、权限、技能和多智能体协调

2026-06-25 03:08 UTC+8

本教程从头构建一个OpenHarness风格的智能体框架，涵盖工具使用、权限控制、记忆、技能、上下文压缩、重试逻辑、成本跟踪和多智能体协调，所有代码均可直接运行。

从零搭建智能体运行时，包含工具、记忆、权限、技能等核心组件。
理解完整控制流程：接收任务、模型决策、工具执行、观察循环。

70%部署客服AI代理的企业在60天内看到投资回报

2026-06-25 02:52 UTC+8

根据Salesforce对3075名服务专业人士的调查，70%使用AI代理的服务组织在60天内报告了积极成果。AI代理在客服领域的采用率从2025年的39%增长到2026年的66%。新的基于成果的定价模式（按解决付费）将加速企业采用。

70%的客服AI代理部署在60天内看到投资回报
AI代理采用率从39%跃升至66%

处理视频留存编辑的自主AI代理

2026-06-25 02:46 UTC+8

AutoEditor是一款AI视频编辑器，旨在通过自动留存编辑来制作病毒式传播的视频。

AI驱动的视频编辑，面向病毒内容
自主留存编辑

AI时代的Drudge Report：AI Titus新闻聚合站上线

2026-06-25 02:39 UTC+8

AI Titus新闻网站模仿Drudge Report风格，整合了AI领域的最新动态，包括Claude自主编写代码占比达65%、Anthropic推出Slack原生'Claude Tag'功能、Sakana Fugu编排API、多个新模型发布以及社区讨论等。

Claude now writes 65% of its own code, Anthropic ships Slack-native 'Claude Tag' for async team delegation.
Sakana 'Fugu' orchestration APIs learn model selection and delegation across many models.

Show HN: Lelu – 基于置信度和提示注入的OpenAI代理门控

2026-06-25 02:39 UTC+8

Lelu 是一个开源授权引擎，用于AI代理的每一次操作，检测提示注入、低置信度决策，并支持人工审核。它通过多层管道（包括置信度门控、策略评估和风险模型）确保安全，并提供OAuth令牌保险库和NHI清单等功能。可自托管，集成主流AI框架。

提示注入检测和置信度门控
多层安全管道：注入过滤、策略评估、风险模型

使用 Amazon Nova 2 Sonic 构建医疗预约语音助手

2026-06-25 02:20 UTC+8

本文介绍如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 构建一个语音助手，用于处理医疗预约提醒对话。该助手能够通过语音验证患者身份、管理预约（确认、取消或改期）、收集就诊前健康信息，并在必要时转接人工客服。它可大规模处理常规电话，有助于降低失约率。示例聚焦于智能代理层面的语音对话与工具编排，并提供基于浏览器的测试界面。

使用 Amazon Nova 2 Sonic 的原生语音到语音模型，保留语气等上下文信息。
通过 Amazon Bedrock AgentCore 实现无服务器运行时，集成七项医疗专用工具。

利用 Snowflake 和 Amazon QuickSight 实现 AI 驱动型商业智能

2026-06-25 02:19 UTC+8

本文介绍了如何构建 Snowflake 语义视图与 Amazon QuickSight 之间的端到端集成，使用电影评论数据作为示例，展示如何通过自然语言查询和分析数据，确保业务逻辑的一致性和减少 AI 幻觉。

语义视图将业务定义直接附加到数据层，确保 AI 和 BI 系统统一解释信息
通过 Cortex Analyst 进行自然语言查询，降低 AI 幻觉风险

政策

微软利用AI在敲诈勒索诉讼中关联两个恶意软件操作

2026-06-25 02:57 UTC+8

微软联合国际执法机构，借助AI分析封禁了与StealC和Amadey恶意软件相关的200多个命令与控制服务器，并依据《反敲诈勒索及腐败组织法》(RICO)提起民事诉讼。这是首次针对网络犯罪供应链而非单一工具的法律行动。

微软使用Copilot等AI工具分析恶意软件，将分析时间从数小时缩短至几分钟。
发现StealC和Amadey共享同一基础设施，促使微软将其作为整体共谋起诉。

研究

Superhuman 收购 AI 检测初创公司 GPTZero，拥有 1900 万以上用户和 3000 万美元 ARR

2026-06-25 02:56 UTC+8

GPTZero 被 Superhuman 收购，后者是 Grammarly 和 Superhuman Mail 的母公司。此次收购将把 GPTZero 的 AI 检测功能整合到电子邮件和更多平台中，以在互联网上维护人类真实性。

GPTZero 被 Superhuman 收购，用户超过 1900 万，ARR 达 3000 万美元。
收购后，AI 检测将直接集成到电子邮件收件箱中。

模型

引用Tom MacWright：AI生成的求职材料导致“意外匿名”

2026-06-25 02:13 UTC+8

Tom MacWright指出，越来越多求职者使用LLM生成的简历、作品集和GitHub项目，导致雇主无法了解申请者的真实能力与个性。

求职材料中AI生成内容增多，简历、作品集、GitHub提交信息均由LLM代笔。
MacWright认为这种趋势使得申请者变得“匿名”，雇主无法获取其真实信息。

其余更新（20 条）

Agent

AI编码代理需要基于证据的审查，而不仅仅是更便宜的路径选择

2026-06-25 02:06 UTC+8

本文分析了AI辅助编码中审查环节的成本，指出模型调用费用仅占总成本的一小部分，真正的瓶颈在于人工审查和返工。通过对比路由、检索增强生成、多模型协商和自动化测试等方法，本文提出了一个验证层应当连接主张与证据、缩小审查范围，并探讨了额外验证的经济效益。

生产力证据矛盾：AI可能增加而非减少审查负担。
模型调用优化上限低，审查时间削减能节省更多成本。

大金应用美洲公司如何借助Genie Code大规模构建一致的数据管道

2026-06-25 02:00 UTC+8

大金应用美洲公司使用Databricks Genie Code重新设计其数据工程运营模型，采用MECE技能框架和勋章架构来确保一致性。这种AI辅助方法加快了管道开发速度，同时保持了治理和与业务概念的协调。

使用MECE技能和勋章架构标准化管道开发。
Genie Code加速迭代并减少样板代码。

Beyond推出人工智能收入管理工具

2026-06-25 01:56 UTC+8

美国收入管理平台Beyond推出了一系列人工智能驱动的工具，旨在帮助自动化定价、优化房源列表并简化运营。新工具包括Listing Lens（AI房源分析器）和MCP服务器测试版，使AI工具能直接连接Beyond的数据。此前推出的AI定价助手Neyoba已为超过15,000名房东和物业经理使用，节省了超过10万小时的手动分析时间。

Beyond推出了新的AI收入管理工具套件
Listing Lens可分析Airbnb房源，提升可见性和预订转化率

在野发现基于网页的间接提示注入攻击

2026-06-25 01:00 UTC+8

Palo Alto Networks Unit 42报告了首次在野检测到的间接提示注入（IDPI）攻击，这些攻击正在被积极武器化。攻击者将隐藏指令嵌入网页内容中，以操纵AI代理，包括一个AI广告审核规避案例。文章基于大规模遥测数据提出了攻击者意图和载荷工程技术的分类。

间接提示注入（IDPI）不再是理论上的威胁；在野攻击已被观测到。
首个有记录的AI广告审核绕过案例，利用网页中的隐藏提示。

Loka 如何利用 Amazon Nova 2 Sonic 构建自然、低延迟的语音代理

2026-06-25 00:56 UTC+8

Loka 使用 Amazon Nova 2 Sonic 构建了对话式 AI 代理，通过原生语音到语音模型解决了传统语音助手延迟高、不自然的问题，实现了低成本、高准确率的客户互动。

传统语音代理因三步处理流程（语音转文本、LLM 处理、文本转语音）导致 3-5 秒延迟，破坏对话自然性，增加成本。
Amazon Nova 2 Sonic 采用端到端语音处理，Big Bench Audio 得分 87.0，首次响应时间 1.39 秒，每小时成本约 0.27 美元。

OpenClaw的ClawHub市场上的恶意AI“技能”绕过扫描器分发信息窃取软件

2026-06-25 00:52 UTC+8

Unit 42研究人员发现，在OpenClaw的ClawHub市场上，恶意行为者通过社交工程和混淆技术发布看似合法的“技能”，诱使用户执行命令，从而部署AMOS和cluw等信息窃取软件。该攻击利用用户辅助执行绕过安全扫描器，对AI代理生态系统构成严重供应链威胁。

Unit 42在2026年2月至5月间发现针对OpenClaw AI代理生态系统的恶意技能活动。
攻击者通过ClawHub发布如tradingview-ai-indicator-assistant等恶意技能，使用paste-site重定向诱骗用户执行base64编码命令。

如果答案已经存在于你的数据中呢？

2026-06-25 00:45 UTC+8

Kythera Labs 在 Databricks 上构建了 AI 原生的医疗战略平台，使任何医疗系统都能获得专家级智能，通过 AI 代理以自然语言回答战略问题，并提供了实际案例：路易斯安那州一家医疗系统在10天内上线，实现了患者就诊可见性提高150%、漏诊减少22%、年化价值380万美元。

Kythera Labs 利用 Databricks 构建 AI 代理，将医疗数据分析专家经验封装，使医疗系统领导能用自然语言提问。
该平台基于3390亿医疗和处方索赔数据，重建患者就诊旅程，提供可信答案。

Figma 推出 AI 动效和着色器工具

2026-06-25 00:15 UTC+8

Figma 在年度 Config 大会上发布了多项设计及编码产品更新，旨在借助 AI 帮助创意人员将想法进一步推进并自动化繁琐任务。重新构想的画布针对全栈开发进行了优化，新增编码层、AI 动效生成、着色器、Figma Weave 工作流、智能代理技能和生成式插件等功能。

重新构想的画布支持全栈开发，团队、AI 代理、工具和材料整合在一处。
编码层允许直接在设计画布上修改代码。

如何为AI Agent构建记忆系统

2026-06-25 00:11 UTC+8

本文介绍了为AI Agent添加记忆功能的实用方法，包括短期记忆和长期记忆的概念、追踪分析以及如何利用LangSmith工具实现记忆循环，从而让Agent从以往交互中学习并改进行为。

记忆让Agent能记住用户偏好和修复过的错误，减少重复纠正。
短期记忆用于当前任务，长期记忆持久化事实、偏好和技能。

政策

科技巨头在单一国会选区投入数百万美元，这不会是最后一次

2026-06-25 01:55 UTC+8

在纽约第12国会选区的民主党初选中，支持与反对AI的团体共投入2400万美元，成为该州历史上最昂贵的同类竞选之一。候选人格雷格·博雷斯因发起AI安全法案成为焦点，但巨额支出的实际影响尚不明确。

纽约第12国会选区的民主党初选总花费超过2400万美元，创下该州记录。
科技行业的政治行动委员会分别支持或反对候选人亚历克斯·博雷斯的AI安全法案。

Show HN：SparQ Pulse – 自托管的 GitHub 原生项目管理工具

2026-06-25 01:53 UTC+8

SparQ Pulse 是一个完全开源的开发者体验套件，专为 GitHub 原生团队设计。它提供项目管理、异步站会、障碍跟踪、团队状态、行动事项、聊天、文档、考勤等功能，并支持可选 AI 集成。技术栈采用 Python、Flask 和 HTMX，可通过 Docker 轻松自托管，数据存储支持 SQLite 或 PostgreSQL。该项目目前已在 GitHub 上获得 12 颗星，采用 AGPL-3.0 许可证。

SparQ Pulse 是首个完全开源的、面向 GitHub 原生团队的开发者体验套件，包含 Pulse、Metrics 和 Knowledge 三个产品模块。
核心功能包括 GitHub 同步、异步站会（支持录音与转录）、障碍看板、团队状态、行动事项（三级紧急度）、实时聊天、文档管理、人员管理、考勤以及可选 AI 助手（OpenAI/Anthropic）。

2700万美元的AI代理人战争以平局告终：亚历克斯·博雷斯失利

2026-06-25 01:25 UTC+8

纽约州议员亚历克斯·博雷斯在民主党初选中以微弱差距输给米卡·拉舍尔，标志着由Anthropic和OpenAI代理的超级政治行动委员会之间耗资2700万美元的代理人战争暂时平息。博雷斯因推动AI监管法案《RAISE法案》而成为焦点，但最终败于地方政治支持和对手的资金优势。

博雷斯以35%对39.1%输给拉舍尔，其他候选人得票率更低。
AI相关超级政治行动委员会总计投入2741万美元，其中支持博雷斯的阵营花费1926万美元，反对阵营花费815万美元。

医疗诊断AI可被诱骗泄露训练数据中的患者身份

2026-06-25 00:46 UTC+8

德国研究人员发现，医疗AI模型容易受到成员推理攻击，可能暴露患者数据，尤其来自代表性不足群体的患者。研究呼吁改进隐私标准和采用差分隐私技术。

医疗AI的判别模型可被攻击者利用，精准识别训练数据中的患者。
攻击成功率几乎完美，尤其针对少数群体患者。

机器人

这些必备智能家居设备超级实用——售价均低于25美元

2026-06-25 01:49 UTC+8

从智能灯泡到家庭安防，亚马逊Prime Day提供了大量必备智能家居设备的超值优惠。

亚马逊Prime Day正在进行中，智能家居设备折扣力度大。
精选多款低于25美元的智能家居产品，包括智能插头、门铃、摄像头等。

工具

Meta发布面向创作者的AI新应用

2026-06-25 01:48 UTC+8

Facebook宣布将Creator Studio工具重新设计为独立AI伴侣应用，帮助创作者在社交网络上扩大受众。此举旨在与TikTok和YouTube竞争，减少创作者对ChatGPT等第三方工具的依赖。

Meta推出AI伴侣应用，帮助创作者在Facebook上扩大受众
该应用重新设计了Creator Studio工具

研究

Show HN：利用AI推荐您的产品或服务

2026-06-25 01:47 UTC+8

一位开发者发现其产品在ChatGPT和Perplexity等AI平台上的推荐流量差异显著，随后开发了一款免费工具。该工具无需注册即可扫描网站，模拟买家查询，评估AI是否推荐您的产品，并与竞争对手对比，提供优化清单以提高AI推荐率。

产品在AI聊天机器人中的推荐流量差异显著，引发深入调查。
开发了免费工具，无需注册即可扫描网站并评估AI推荐情况。

芯片

高通收购AI平台开发商Modular

2026-06-25 01:25 UTC+8

此次收购扩大了这家芯片制造商从边缘设备到数据中心的AI基础设施野心。

高通收购AI平台开发商Modular，拓展AI基础设施业务
此举将高通的AI布局从边缘设备延伸至数据中心

模型

思考即回忆：推理如何解锁大语言模型中的参数化知识

2026-06-25 00:51 UTC+8

Google Research 的研究揭示了一个反直觉的现象：即使对于简单的事实性问题，让大语言模型生成推理链也能提高答案的准确性。研究发现两种机制：计算缓冲（生成额外标记用于潜在计算）和事实启动（生成相关事实以帮助召回正确答案）。

推理帮助模型召回原本无法获取的简单事实，即使无需逐步推理。
机制一：计算缓冲——生成无意义的推理标记也提供额外计算，提升召回。

使用NVIDIA NeMo AutoModel加速Transformer微调

2026-06-25 00:00 UTC+8

NVIDIA NeMo AutoModel基于HuggingFace Transformers v5，通过专家并行、DeepEP融合通信和TransformerEngine内核，将MoE模型微调的训练吞吐量提升3.4-3.7倍，GPU内存减少29-32%，且无需更改API。

NeMo AutoModel继承AutoModelForCausalLM，仅需更改导入行即可实现性能提升。
在550B规模模型上，专家并行使全微调在16节点H100集群上可行，而Transformers v5因内存不足无法运行。

n8n的LlamaParse平台节点：利用AI解析、分类、提取和检索文档

2026-06-25 00:08 UTC+8

LlamaParse平台社区节点已发布v5和v6版本，现为n8n官方验证的社区节点。该节点整合了五个LlamaCloud资源（解析、分类、拆分、提取、检索），支持作为AI Agent工具使用。v5重写了基础架构，v6将多个独立节点整合为一个，并增加了索引管理功能。文章还提供了三种工作流示例：将检索器作为Agent工具、构建分类-提取-验证流水线、以及评估不同解析模式的输出质量。

LlamaParse平台节点提供五个资源：解析、分类、拆分、提取和检索，均支持作为n8n AI Agent的工具。
v5版本放弃了SDK，改用直接HTTP调用，并迁移提取功能至V2，支持可配置API基础URL。