AI News HubLIVE

实时更新

NVIDIA研究推动机器人技术从模拟走向现实世界

在ICRA上,NVIDIA Research展示了28篇论文中的8篇,重点研究模拟到现实的迁移,使机器人能够在动态、不可预测的环境中感知、推理、规划和行动。这些方法涵盖多臂协调、跨机器人导航、抓取、精确装配和视觉-语言-动作模型,显著提高了成功率和可靠性。

  • NVIDIA在ICRA上提交了8篇关于模拟到现实迁移的论文
  • 方法包括ScheduleStream、COMPASS、Grasp-MPC、SPARR等
站内正文

我们如何构建Cloudflare的数据平台及其之上的AI智能体

Cloudflare每秒处理超过十亿事件,但数据分散在多个系统,难以访问。为解决这一问题,他们构建了Town Lake统一数据分析平台和Skipper AI数据智能体。Town Lake提供单一SQL接口,Skipper允许用自然语言提问并获得可审计的答案。文章详细介绍了平台架构、治理策略(默认关闭权限)以及AI智能体的工作原理。

  • Cloudflare构建了Town Lake统一数据平台和Skipper AI智能体,解决数据分散问题。
  • Town Lake采用数据湖仓架构,使用Trino查询引擎、R2存储和Iceberg表格式。
站内正文

我是iPhone用户,但Gemini搭配Android Auto在车里比Siri好用 - 原因在这里

作为一名iPhone用户,作者通常在开车时使用Siri和CarPlay,但尝试了Android Auto上的Gemini后,发现Gemini能处理更多任务,包括发送邮件、获取餐厅信息、玩游戏等,且设置简单。作者认为Gemini是更一站式的人工智能助手。

  • 作者是iPhone用户,但认为Gemini搭配Android Auto在车里比Siri更好用。
  • Gemini可以处理从基本指令到复杂交互的各种任务,如发送邮件、获取本地信息等。
站内正文

如果AI编程的真正关键是老套而无聊的做法呢?

文章认为,AI辅助软件开发的关键并非更好的规格说明或工具,而是古老的小批量与快速反馈循环实践。数据显示,更快的代码生成导致设计、测试和审查环节出现瓶颈,反而使交付变慢、发布更不稳定。真正的杠杆在于缩小批量、缩短反馈周期。

  • AI代码生成加速了编写,但产生了设计、测试、审查等环节的瓶颈。
  • 来自DORA、CircleCI和Faros的数据表明,阶段门控流程导致交付更慢、更不稳定。
站内正文

Mistral 将 LeChat 更名为 Vibe,押注聊天机器人的未来是全能工作代理

Mistral AI 将其聊天机器人 Le Chat 更名为 Vibe,并将聊天、编程代理和新的工作模式整合在一个品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,独立处理电子邮件、报告或拉取请求等任务。Pro 套餐价格从 17.99 欧元降至 14.99 欧元,但未明确使用限制。此举直接对标 OpenAI、Google 和 Anthropic 的代理型产品。

  • Mistral AI 将聊天机器人 Le Chat 更名为 Vibe,整合聊天、编程代理和工作模式。
  • 工作模式可连接 Google Workspace、Outlook、Slack 或 GitHub,自主处理任务。
站内正文

我们为何将OpenLoomi AI开源

OpenLoomi AI团队决定将其AI工作伙伴开源,强调数据所有权、透明度和社区驱动。文章阐述了本地优先、闭源信任税、基础设施公共化等理念,并介绍了产品的五大核心功能:自进化记忆系统、多平台集成、自动化调度、本地加密存储以及开放技能接口。

  • OpenLoomi采用本地优先架构,用户数据加密存储于本地,绝不用于训练模型。
  • 开源消除了对闭源软件的信任依赖,代码可审计、可分支、可自托管。
站内正文

英伟达每年将向台湾投入1500亿美元用于AI基础设施

黄仁勋宣布英伟达将每年在台湾投入1500亿美元建设AI基础设施,尽管此前承诺了5000亿美元美国投资。这凸显了台湾在全球AI芯片制造和封装生态系统中的核心地位。

  • 英伟达每年将在台湾投入1500亿美元用于AI基础设施。
  • 尽管此前宣布了5000亿美元的美国数据中心投资,但台湾仍是关键制造基地。
站内正文

英伟达押注1500亿美元在台湾,特朗普让美国成为AI中心的计划适得其反

英伟达CEO黄仁勋计划在台湾投资1500亿美元建设AI基础设施,尽管特朗普政府试图通过关税将芯片制造带回美国。台湾拒绝放弃其半导体主导地位,而美国芯片制造能力不足。

  • 英伟达宣布1500亿美元台湾投资,巩固其AI芯片地位。
  • 特朗普政府考虑对半导体征收高额关税以促进国内制造,但美国仅生产约10%所需芯片。
站内正文

2026年值得构建的7个真实世界AI项目(附指南)

本文介绍了七个实用的AI项目,涵盖求职、研究、投资分析、市场趋势、发票处理、图表数字化和个性化锻炼,每个项目都附有完整指南和代码,帮助读者自动化工作流程。

  • 学习构建AI求职助手,自动匹配职位与简历
  • 掌握多智能体研究助理开发,生成带来源的研究报告
站内正文

AI聚合平台估值达13亿美元

该供应商的增长与企业AI中代理的爆炸性出现同步。

  • AI聚合平台估值达到13亿美元。
  • 其增长与企业AI代理的兴起密切相关。
站内正文

Show HN:本地编码代理——利用LLM将工具调用委托给小AI模型

Open Agent Tools (oats) 是一个自托管AI模型框架,通过本地代码提示索引,将大型模型的计算密集型工具调用委托给小型开源模型,从而节省令牌消耗。

  • oats 允许本地AI模型使用本地源代码进行工具调用,无需HTTP或MCP。
  • 通过数据挖掘超过20,000个GitHub仓库,创建可重用的提示索引。
站内正文

人工智能本质上就是反社会的吗?

本文对比早期互联网带来的连接感与当代人工智能的孤立体验,指出AI作为一种工具虽有用,却无法替代真实的人类互动,并质疑AI是否存在真正促进社交的应用场景。

  • 早期互联网强调“我们”的集体体验,而AI交互往往是个人的、孤立的。
  • 作者认为AI是出色的工具,但不是人,也无法替代人。
站内正文

研究称AI不喜欢宗教——尤其是耶和华见证人

一项由宗教大学联盟进行的研究发现,主要AI模型在回答伦理问题时倾向于世俗理性主义,忽视宗教视角。所有模型对耶和华见证人表现出负面偏见,而对天主教有正面偏见。

  • AI模型在伦理和个人问题上几乎不引用宗教观点,存在“遗漏偏见”。
  • 所有测试的AI模型对耶和华见证人均有持续负面偏见。
站内正文

你的AI助手已经忘记了你告诉它的一半内容

本文是AI驱动开发系列文章的第七篇,重点讨论AI会话中的上下文管理。作者通过个人经历(Gemini移动应用忘记之前记录的笔记)引出上下文压缩问题,并分享了四种实用技巧:将探索与文档编写分离、使用交接文档而非延续提示、给AI设定验收标准而非详细步骤、以及使用规范文档作为不同AI工具之间的桥梁。这些技巧适用于从编程到写作的各种AI使用场景。

  • AI助手在长对话中会因上下文窗口限制而“忘记”早期信息,这种现象称为上下文压缩。
  • 四种实用技巧:分离探索与文档编写、使用交接文档、设定验收标准、使用规范文档作为桥梁。
站内正文

Show HN:我将一个 Python AI 代理和 Vue 仪表盘打包成了一个 Electron 应用

Hermes Desktop 是一个跨平台的桌面应用,它将 Python 运行时、hermes-agent(自改进 AI 代理)和 hermes-web-ui(Vue 3 + Koa 聊天仪表盘)打包到一个 Electron 应用中,用户无需单独安装 Python 或 Node。应用集成了 DingTalk 并通过 DeepSeek 驱动。

  • 打包了 Python 运行时和 hermes-agent,实现无需依赖即可运行
  • 使用 Electron 作为外壳,集成 hermes-web-ui 前端
站内正文

NBA计划使用AI系统自动判定界外球

NBA总裁亚当·肖华宣布,联盟将引入一套基于AI和摄像头的自动化系统,用于判定界外球等客观裁判决策。该系统类似网球中的鹰眼技术,旨在即时确定球权归属,减少比赛停顿。肖华表示,裁判仍负责涉及接触和犯规的判罚。

  • NBA计划推出AI自动化判罚系统,首先应用于界外球判定。
  • 系统利用场内摄像头和AI技术,类似网球鹰眼,实现即时球权判定。
站内正文

Midday – 面向自由职业者的开源发票、时间跟踪、文件核对、存储等一体化工具

Midday 是一款开源的全能商务助手,专为自由职业者、承包商和个体创业者设计,集时间跟踪、发票管理、文件核对、存储和财务概览于一体,并配备 AI 助手。

  • 开源工具,整合多项商务功能,适合自由职业者和个体经营者。
  • 功能包括实时时间跟踪、即将推出的网页发票、安全文件存储、自动发票匹配和 AI 财务洞察。
站内正文

Money Printer Pro —— 开源 AI 内容生成器

Money Printer Pro 是一个基于 Google Gemini 和 VEO 3.1 的开源 AI 内容生成器,可创建逼真的图像和电影级视频,并保持身份一致性。它拥有 7 个视觉引擎、自动批量生成、AI 质量评分和发布把关功能,用户直接向 Google 付费,无需额外订阅。

  • 支持图像和视频生成,包括多镜头视频序列。
  • 身份锁定引擎确保同一人物在不同生成中面部一致。
站内正文

Meta One:扎克伯格终于为AI支出标价

Meta正在全球范围内为Instagram、Facebook和WhatsApp推出付费附加功能,同时构建独立的付费AI服务。这是Meta首次明确将AI支出转化为收入来源。

  • Meta在全球推出付费附加功能,覆盖Instagram、Facebook和WhatsApp。
  • 同时开发独立的付费AI产品,将AI投入货币化。
站内正文

Dirk和Linus讨论AI与内核开发

一篇LWN.net上的订阅文章,由Joe Brockmeier撰写,报道了Dirk和Linus关于AI与内核开发的讨论。该内容仅供订阅者查看。

  • 文章作者为Joe Brockmeier,发布于2026年5月25日
  • 文章在OSSNA活动中呈现
站内正文

Superpowers:AI编码工作流的代理技能框架

Superpowers是一个为AI编码代理设计的完整软件开发方法论,基于一组可组合的技能和初始指令。它强调测试驱动开发、设计先行、子代理驱动的迭代,并支持多种编码助手(如Claude Code、Codex CLI等)。

  • Superpowers提供一套技能库,包括测试驱动开发、系统调试、协作规划等,使AI代理能自主工作数小时。
  • 工作流程从头脑风暴规范开始,经设计批准后生成实现计划,再通过子代理逐任务执行并审查。
站内正文

信任模型正在翻转

随着AI代码审查工具(如Anthropic的Claude Mythos)展现出比人类更强大的安全漏洞发现能力,软件安全的信任基础正从人类编写的代码转向AI审查的代码。文章以Mozilla Firefox为例,Mythos在单个评估周期内发现了271个漏洞,远超人类团队。这意味着人类在安全审查中的角色需要从“编写和审查实现”转向“定义软件的意图并验证实现是否偏离”。

  • 人类编写代码的安全预设正在被打破,AI审查代码逐渐获得信任。
  • Mozilla使用Claude Mythos在Firefox中发现了271个漏洞,凸显AI的审查能力。
站内正文

Perplexity AI 开源Unigram分词器,p50延迟比Hugging Face tokenizers crate低5倍

Perplexity AI 开源了用Rust重写的Unigram分词器,实现了比Hugging Face tokenizers crate低5倍的p50延迟,并将生产环境CPU利用率降低了5-6倍。优化包括双数组trie、位图打包和大页面支持。

  • Perplexity AI 用Rust重写了Unigram分词器,p50延迟比Hugging Face tokenizers crate降低5倍。
  • 三项优化:双数组trie、位图和缓存行打包、大页面支持。
站内正文

这位高管分享在代理式AI时代成为成功创新者的4种方法

美国运通全球创新主管Luke Gebb分享了成为成功创新者的四个关键实践:保持学习、深入技术、接受失败、建立合作伙伴关系。他还介绍了公司在代理式商务领域的布局,包括支付、优惠和专有体验,并预测代理式AI将在未来几年加速发展。

  • 保持好奇心和学习欲望,培养成长型思维
  • 深入理解新兴技术并与工程师紧密合作
站内正文

亚马逊打造自有AI制作平台,为Prime Video批准三部AI动画系列

亚马逊米高梅影业与AWS联合推出“GenAI创作者基金”,为电影制作人提供资金及内部AI平台“Project Nara”的访问权限。三部动画系列已投入制作,团队仅用五周完成试播集。亚马逊宣称拥有“行业内唯一端到端AI内容生态系统”。

  • 亚马逊设立GenAI创作者基金,支持AI内容创作
  • 内部AI平台Project Nara用于动画制作
站内正文

Mistral CEO称公司探索自研芯片

Mistral AI首席执行官Arthur Mensch证实,公司正在探索开发定制芯片以降低基础设施成本,与OpenAI和Anthropic竞争。这家法国初创公司还宣布在法国新建推理数据中心,并推出企业智能代理平台Vibe。

  • Mistral AI考虑自研定制芯片以降低部署成本。
  • 公司在法国新建专用推理数据中心。
站内正文

YouTube 将让你通过AI创建自定义视频推送

YouTube推出新的AI功能,允许用户通过描述性提示生成个性化视频推送,并可以固定在主页顶部。该功能目前在美国以英语支持的形式向YouTube移动应用和桌面端用户推出。

  • 用户可通过输入描述性提示(如“帮我放松,引导冥想不超过10分钟”)来创建自定义视频推送。
  • 该功能类似Spotify的提示播放列表和Instagram的Reels算法控制,但使用自由文本提示而非主题列表。
站内正文

Taste Skill:面向AI代理的反模板前端框架

Taste Skill 是一个开源前端框架,旨在提升AI生成界面的设计质量,避免产生千篇一律的模板化外观。它提供多种可组合的技能模块,包括设计调优、代码生成和图像生成,支持通过 npx 命令行或直接复制 SKILL.md 文件集成到项目中。

  • Taste Skill 通过可调节的设计参数(布局、动画、密度)让AI生成的界面更具设计感
  • 提供多种专用技能模块,如设计调优、代码生成、图像生成等
站内正文

Netflix正在建立AI动画工作室

Netflix正在建立名为INKubator的新内部工作室,利用AI制作短篇动画内容。该工作室已悄然启动,正在招聘各种职位,包括制片人、软件工程师和CG艺术家。其长期技术战略聚焦于生成式AI工作流程、艺术家工具和可扩展的多节目环境,旨在制作出达到电影品质的内容。目前计划专注于动画短片和特辑,但有迹象表明未来可能扩展到长篇内容。此举可能用于Netflix的Clips功能或儿童节目。然而,AI在动画领域的应用也引发了强烈反弹,包括日本动画大师宫崎骏的批评和动画师工会的抗议。

  • Netflix建立新AI动画工作室INKubator,专注于生成式AI驱动的短篇动画。
  • 工作室由前梦工厂和A24高管领导,已开始招聘关键职位。
站内正文