AI News HubLIVE

今日必读

Agent

如何设计一个OpenHarness风格的智能体运行时:包含工具、记忆、权限、技能和多智能体协调

本教程从头构建一个OpenHarness风格的智能体框架,涵盖工具使用、权限控制、记忆、技能、上下文压缩、重试逻辑、成本跟踪和多智能体协调,所有代码均可直接运行。

  • 从零搭建智能体运行时,包含工具、记忆、权限、技能等核心组件。
  • 理解完整控制流程:接收任务、模型决策、工具执行、观察循环。
站内正文

70%部署客服AI代理的企业在60天内看到投资回报

根据Salesforce对3075名服务专业人士的调查,70%使用AI代理的服务组织在60天内报告了积极成果。AI代理在客服领域的采用率从2025年的39%增长到2026年的66%。新的基于成果的定价模式(按解决付费)将加速企业采用。

  • 70%的客服AI代理部署在60天内看到投资回报
  • AI代理采用率从39%跃升至66%
站内正文

处理视频留存编辑的自主AI代理

AutoEditor是一款AI视频编辑器,旨在通过自动留存编辑来制作病毒式传播的视频。

  • AI驱动的视频编辑,面向病毒内容
  • 自主留存编辑
站内正文

AI时代的Drudge Report:AI Titus新闻聚合站上线

AI Titus新闻网站模仿Drudge Report风格,整合了AI领域的最新动态,包括Claude自主编写代码占比达65%、Anthropic推出Slack原生'Claude Tag'功能、Sakana Fugu编排API、多个新模型发布以及社区讨论等。

  • Claude now writes 65% of its own code, Anthropic ships Slack-native 'Claude Tag' for async team delegation.
  • Sakana 'Fugu' orchestration APIs learn model selection and delegation across many models.
站内正文

Show HN: Lelu – 基于置信度和提示注入的OpenAI代理门控

Lelu 是一个开源授权引擎,用于AI代理的每一次操作,检测提示注入、低置信度决策,并支持人工审核。它通过多层管道(包括置信度门控、策略评估和风险模型)确保安全,并提供OAuth令牌保险库和NHI清单等功能。可自托管,集成主流AI框架。

  • 提示注入检测和置信度门控
  • 多层安全管道:注入过滤、策略评估、风险模型
站内正文

使用 Amazon Nova 2 Sonic 构建医疗预约语音助手

本文介绍如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 构建一个语音助手,用于处理医疗预约提醒对话。该助手能够通过语音验证患者身份、管理预约(确认、取消或改期)、收集就诊前健康信息,并在必要时转接人工客服。它可大规模处理常规电话,有助于降低失约率。示例聚焦于智能代理层面的语音对话与工具编排,并提供基于浏览器的测试界面。

  • 使用 Amazon Nova 2 Sonic 的原生语音到语音模型,保留语气等上下文信息。
  • 通过 Amazon Bedrock AgentCore 实现无服务器运行时,集成七项医疗专用工具。
站内正文

利用 Snowflake 和 Amazon QuickSight 实现 AI 驱动型商业智能

本文介绍了如何构建 Snowflake 语义视图与 Amazon QuickSight 之间的端到端集成,使用电影评论数据作为示例,展示如何通过自然语言查询和分析数据,确保业务逻辑的一致性和减少 AI 幻觉。

  • 语义视图将业务定义直接附加到数据层,确保 AI 和 BI 系统统一解释信息
  • 通过 Cortex Analyst 进行自然语言查询,降低 AI 幻觉风险
站内正文
政策

微软利用AI在敲诈勒索诉讼中关联两个恶意软件操作

微软联合国际执法机构,借助AI分析封禁了与StealC和Amadey恶意软件相关的200多个命令与控制服务器,并依据《反敲诈勒索及腐败组织法》(RICO)提起民事诉讼。这是首次针对网络犯罪供应链而非单一工具的法律行动。

  • 微软使用Copilot等AI工具分析恶意软件,将分析时间从数小时缩短至几分钟。
  • 发现StealC和Amadey共享同一基础设施,促使微软将其作为整体共谋起诉。
站内正文
研究

Superhuman 收购 AI 检测初创公司 GPTZero,拥有 1900 万以上用户和 3000 万美元 ARR

GPTZero 被 Superhuman 收购,后者是 Grammarly 和 Superhuman Mail 的母公司。此次收购将把 GPTZero 的 AI 检测功能整合到电子邮件和更多平台中,以在互联网上维护人类真实性。

  • GPTZero 被 Superhuman 收购,用户超过 1900 万,ARR 达 3000 万美元。
  • 收购后,AI 检测将直接集成到电子邮件收件箱中。
站内正文
模型

引用Tom MacWright:AI生成的求职材料导致“意外匿名”

Tom MacWright指出,越来越多求职者使用LLM生成的简历、作品集和GitHub项目,导致雇主无法了解申请者的真实能力与个性。

  • 求职材料中AI生成内容增多,简历、作品集、GitHub提交信息均由LLM代笔。
  • MacWright认为这种趋势使得申请者变得“匿名”,雇主无法获取其真实信息。
站内正文
其余更新(20 条)
Agent

AI编码代理需要基于证据的审查,而不仅仅是更便宜的路径选择

本文分析了AI辅助编码中审查环节的成本,指出模型调用费用仅占总成本的一小部分,真正的瓶颈在于人工审查和返工。通过对比路由、检索增强生成、多模型协商和自动化测试等方法,本文提出了一个验证层应当连接主张与证据、缩小审查范围,并探讨了额外验证的经济效益。

  • 生产力证据矛盾:AI可能增加而非减少审查负担。
  • 模型调用优化上限低,审查时间削减能节省更多成本。
站内正文

大金应用美洲公司如何借助Genie Code大规模构建一致的数据管道

大金应用美洲公司使用Databricks Genie Code重新设计其数据工程运营模型,采用MECE技能框架和勋章架构来确保一致性。这种AI辅助方法加快了管道开发速度,同时保持了治理和与业务概念的协调。

  • 使用MECE技能和勋章架构标准化管道开发。
  • Genie Code加速迭代并减少样板代码。
站内正文

Beyond推出人工智能收入管理工具

美国收入管理平台Beyond推出了一系列人工智能驱动的工具,旨在帮助自动化定价、优化房源列表并简化运营。新工具包括Listing Lens(AI房源分析器)和MCP服务器测试版,使AI工具能直接连接Beyond的数据。此前推出的AI定价助手Neyoba已为超过15,000名房东和物业经理使用,节省了超过10万小时的手动分析时间。

  • Beyond推出了新的AI收入管理工具套件
  • Listing Lens可分析Airbnb房源,提升可见性和预订转化率
站内正文

在野发现基于网页的间接提示注入攻击

Palo Alto Networks Unit 42报告了首次在野检测到的间接提示注入(IDPI)攻击,这些攻击正在被积极武器化。攻击者将隐藏指令嵌入网页内容中,以操纵AI代理,包括一个AI广告审核规避案例。文章基于大规模遥测数据提出了攻击者意图和载荷工程技术的分类。

  • 间接提示注入(IDPI)不再是理论上的威胁;在野攻击已被观测到。
  • 首个有记录的AI广告审核绕过案例,利用网页中的隐藏提示。
站内正文

Loka 如何利用 Amazon Nova 2 Sonic 构建自然、低延迟的语音代理

Loka 使用 Amazon Nova 2 Sonic 构建了对话式 AI 代理,通过原生语音到语音模型解决了传统语音助手延迟高、不自然的问题,实现了低成本、高准确率的客户互动。

  • 传统语音代理因三步处理流程(语音转文本、LLM 处理、文本转语音)导致 3-5 秒延迟,破坏对话自然性,增加成本。
  • Amazon Nova 2 Sonic 采用端到端语音处理,Big Bench Audio 得分 87.0,首次响应时间 1.39 秒,每小时成本约 0.27 美元。
站内正文

OpenClaw的ClawHub市场上的恶意AI“技能”绕过扫描器分发信息窃取软件

Unit 42研究人员发现,在OpenClaw的ClawHub市场上,恶意行为者通过社交工程和混淆技术发布看似合法的“技能”,诱使用户执行命令,从而部署AMOS和cluw等信息窃取软件。该攻击利用用户辅助执行绕过安全扫描器,对AI代理生态系统构成严重供应链威胁。

  • Unit 42在2026年2月至5月间发现针对OpenClaw AI代理生态系统的恶意技能活动。
  • 攻击者通过ClawHub发布如tradingview-ai-indicator-assistant等恶意技能,使用paste-site重定向诱骗用户执行base64编码命令。
站内正文

如果答案已经存在于你的数据中呢?

Kythera Labs 在 Databricks 上构建了 AI 原生的医疗战略平台,使任何医疗系统都能获得专家级智能,通过 AI 代理以自然语言回答战略问题,并提供了实际案例:路易斯安那州一家医疗系统在10天内上线,实现了患者就诊可见性提高150%、漏诊减少22%、年化价值380万美元。

  • Kythera Labs 利用 Databricks 构建 AI 代理,将医疗数据分析专家经验封装,使医疗系统领导能用自然语言提问。
  • 该平台基于3390亿医疗和处方索赔数据,重建患者就诊旅程,提供可信答案。
站内正文

Figma 推出 AI 动效和着色器工具

Figma 在年度 Config 大会上发布了多项设计及编码产品更新,旨在借助 AI 帮助创意人员将想法进一步推进并自动化繁琐任务。重新构想的画布针对全栈开发进行了优化,新增编码层、AI 动效生成、着色器、Figma Weave 工作流、智能代理技能和生成式插件等功能。

  • 重新构想的画布支持全栈开发,团队、AI 代理、工具和材料整合在一处。
  • 编码层允许直接在设计画布上修改代码。
站内正文

如何为AI Agent构建记忆系统

本文介绍了为AI Agent添加记忆功能的实用方法,包括短期记忆和长期记忆的概念、追踪分析以及如何利用LangSmith工具实现记忆循环,从而让Agent从以往交互中学习并改进行为。

  • 记忆让Agent能记住用户偏好和修复过的错误,减少重复纠正。
  • 短期记忆用于当前任务,长期记忆持久化事实、偏好和技能。
站内正文
政策

科技巨头在单一国会选区投入数百万美元,这不会是最后一次

在纽约第12国会选区的民主党初选中,支持与反对AI的团体共投入2400万美元,成为该州历史上最昂贵的同类竞选之一。候选人格雷格·博雷斯因发起AI安全法案成为焦点,但巨额支出的实际影响尚不明确。

  • 纽约第12国会选区的民主党初选总花费超过2400万美元,创下该州记录。
  • 科技行业的政治行动委员会分别支持或反对候选人亚历克斯·博雷斯的AI安全法案。
站内正文

Show HN:SparQ Pulse – 自托管的 GitHub 原生项目管理工具

SparQ Pulse 是一个完全开源的开发者体验套件,专为 GitHub 原生团队设计。它提供项目管理、异步站会、障碍跟踪、团队状态、行动事项、聊天、文档、考勤等功能,并支持可选 AI 集成。技术栈采用 Python、Flask 和 HTMX,可通过 Docker 轻松自托管,数据存储支持 SQLite 或 PostgreSQL。该项目目前已在 GitHub 上获得 12 颗星,采用 AGPL-3.0 许可证。

  • SparQ Pulse 是首个完全开源的、面向 GitHub 原生团队的开发者体验套件,包含 Pulse、Metrics 和 Knowledge 三个产品模块。
  • 核心功能包括 GitHub 同步、异步站会(支持录音与转录)、障碍看板、团队状态、行动事项(三级紧急度)、实时聊天、文档管理、人员管理、考勤以及可选 AI 助手(OpenAI/Anthropic)。
站内正文

2700万美元的AI代理人战争以平局告终:亚历克斯·博雷斯失利

纽约州议员亚历克斯·博雷斯在民主党初选中以微弱差距输给米卡·拉舍尔,标志着由Anthropic和OpenAI代理的超级政治行动委员会之间耗资2700万美元的代理人战争暂时平息。博雷斯因推动AI监管法案《RAISE法案》而成为焦点,但最终败于地方政治支持和对手的资金优势。

  • 博雷斯以35%对39.1%输给拉舍尔,其他候选人得票率更低。
  • AI相关超级政治行动委员会总计投入2741万美元,其中支持博雷斯的阵营花费1926万美元,反对阵营花费815万美元。
站内正文

医疗诊断AI可被诱骗泄露训练数据中的患者身份

德国研究人员发现,医疗AI模型容易受到成员推理攻击,可能暴露患者数据,尤其来自代表性不足群体的患者。研究呼吁改进隐私标准和采用差分隐私技术。

  • 医疗AI的判别模型可被攻击者利用,精准识别训练数据中的患者。
  • 攻击成功率几乎完美,尤其针对少数群体患者。
站内正文
机器人

这些必备智能家居设备超级实用——售价均低于25美元

从智能灯泡到家庭安防,亚马逊Prime Day提供了大量必备智能家居设备的超值优惠。

  • 亚马逊Prime Day正在进行中,智能家居设备折扣力度大。
  • 精选多款低于25美元的智能家居产品,包括智能插头、门铃、摄像头等。
站内正文
工具

Meta发布面向创作者的AI新应用

Facebook宣布将Creator Studio工具重新设计为独立AI伴侣应用,帮助创作者在社交网络上扩大受众。此举旨在与TikTok和YouTube竞争,减少创作者对ChatGPT等第三方工具的依赖。

  • Meta推出AI伴侣应用,帮助创作者在Facebook上扩大受众
  • 该应用重新设计了Creator Studio工具
站内正文
研究

Show HN:利用AI推荐您的产品或服务

一位开发者发现其产品在ChatGPT和Perplexity等AI平台上的推荐流量差异显著,随后开发了一款免费工具。该工具无需注册即可扫描网站,模拟买家查询,评估AI是否推荐您的产品,并与竞争对手对比,提供优化清单以提高AI推荐率。

  • 产品在AI聊天机器人中的推荐流量差异显著,引发深入调查。
  • 开发了免费工具,无需注册即可扫描网站并评估AI推荐情况。
站内正文
芯片

高通收购AI平台开发商Modular

此次收购扩大了这家芯片制造商从边缘设备到数据中心的AI基础设施野心。

  • 高通收购AI平台开发商Modular,拓展AI基础设施业务
  • 此举将高通的AI布局从边缘设备延伸至数据中心
站内正文
模型

思考即回忆:推理如何解锁大语言模型中的参数化知识

Google Research 的研究揭示了一个反直觉的现象:即使对于简单的事实性问题,让大语言模型生成推理链也能提高答案的准确性。研究发现两种机制:计算缓冲(生成额外标记用于潜在计算)和事实启动(生成相关事实以帮助召回正确答案)。

  • 推理帮助模型召回原本无法获取的简单事实,即使无需逐步推理。
  • 机制一:计算缓冲——生成无意义的推理标记也提供额外计算,提升召回。
站内正文

使用NVIDIA NeMo AutoModel加速Transformer微调

NVIDIA NeMo AutoModel基于HuggingFace Transformers v5,通过专家并行、DeepEP融合通信和TransformerEngine内核,将MoE模型微调的训练吞吐量提升3.4-3.7倍,GPU内存减少29-32%,且无需更改API。

  • NeMo AutoModel继承AutoModelForCausalLM,仅需更改导入行即可实现性能提升。
  • 在550B规模模型上,专家并行使全微调在16节点H100集群上可行,而Transformers v5因内存不足无法运行。
站内正文

n8n的LlamaParse平台节点:利用AI解析、分类、提取和检索文档

LlamaParse平台社区节点已发布v5和v6版本,现为n8n官方验证的社区节点。该节点整合了五个LlamaCloud资源(解析、分类、拆分、提取、检索),支持作为AI Agent工具使用。v5重写了基础架构,v6将多个独立节点整合为一个,并增加了索引管理功能。文章还提供了三种工作流示例:将检索器作为Agent工具、构建分类-提取-验证流水线、以及评估不同解析模式的输出质量。

  • LlamaParse平台节点提供五个资源:解析、分类、拆分、提取和检索,均支持作为n8n AI Agent的工具。
  • v5版本放弃了SDK,改用直接HTTP调用,并迁移提取功能至V2,支持可配置API基础URL。