AI News HubLIVE

实时更新

亚马逊打造自有AI制作平台,为Prime Video批准三部AI动画系列

亚马逊米高梅影业与AWS联合推出“GenAI创作者基金”,为电影制作人提供资金及内部AI平台“Project Nara”的访问权限。三部动画系列已投入制作,团队仅用五周完成试播集。亚马逊宣称拥有“行业内唯一端到端AI内容生态系统”。

  • 亚马逊设立GenAI创作者基金,支持AI内容创作
  • 内部AI平台Project Nara用于动画制作
站内正文

Mistral CEO称公司探索自研芯片

Mistral AI首席执行官Arthur Mensch证实,公司正在探索开发定制芯片以降低基础设施成本,与OpenAI和Anthropic竞争。这家法国初创公司还宣布在法国新建推理数据中心,并推出企业智能代理平台Vibe。

  • Mistral AI考虑自研定制芯片以降低部署成本。
  • 公司在法国新建专用推理数据中心。
站内正文

YouTube 将让你通过AI创建自定义视频推送

YouTube推出新的AI功能,允许用户通过描述性提示生成个性化视频推送,并可以固定在主页顶部。该功能目前在美国以英语支持的形式向YouTube移动应用和桌面端用户推出。

  • 用户可通过输入描述性提示(如“帮我放松,引导冥想不超过10分钟”)来创建自定义视频推送。
  • 该功能类似Spotify的提示播放列表和Instagram的Reels算法控制,但使用自由文本提示而非主题列表。
站内正文

Taste Skill:面向AI代理的反模板前端框架

Taste Skill 是一个开源前端框架,旨在提升AI生成界面的设计质量,避免产生千篇一律的模板化外观。它提供多种可组合的技能模块,包括设计调优、代码生成和图像生成,支持通过 npx 命令行或直接复制 SKILL.md 文件集成到项目中。

  • Taste Skill 通过可调节的设计参数(布局、动画、密度)让AI生成的界面更具设计感
  • 提供多种专用技能模块,如设计调优、代码生成、图像生成等
站内正文

Netflix正在建立AI动画工作室

Netflix正在建立名为INKubator的新内部工作室,利用AI制作短篇动画内容。该工作室已悄然启动,正在招聘各种职位,包括制片人、软件工程师和CG艺术家。其长期技术战略聚焦于生成式AI工作流程、艺术家工具和可扩展的多节目环境,旨在制作出达到电影品质的内容。目前计划专注于动画短片和特辑,但有迹象表明未来可能扩展到长篇内容。此举可能用于Netflix的Clips功能或儿童节目。然而,AI在动画领域的应用也引发了强烈反弹,包括日本动画大师宫崎骏的批评和动画师工会的抗议。

  • Netflix建立新AI动画工作室INKubator,专注于生成式AI驱动的短篇动画。
  • 工作室由前梦工厂和A24高管领导,已开始招聘关键职位。
站内正文

AIluminode:检索前认知定向工具

AIluminode 是一款轻量级 AI 预检索认知定向工具,帮助 AI 在行动前检查上下文姿态,通过路线极性(开放、保护、审计、延迟、阻断)减少错误探索和上下文泄漏。

  • AIluminode 是一个可 wieldable 的预检索认知定向工具,强调“姿态先于检索”。
  • 它使用路线极性系统(OPEN / PROTECT / AUDIT / DEFER / BLOCK)来引导上下文路由。
站内正文

5篇AI生成的数学论文被接收!00后创始人洪乐潼融资14个亿

Axiom Math公司由00后华人洪乐潼创立,其AI系统AxiomProver生成的8篇数学论文中已有5篇被学术期刊接收。该公司于今年3月完成2亿美元融资,估值达16亿美元。

  • Axiom Math的AI系统AxiomProver生成的8篇数学论文中,5篇已通过同行评审并发表。
  • 创始人洪乐潼从斯坦福退学创业,公司融资2亿美元,估值16亿美元。
站内正文

7B打败o3、GPT-5!医学AI智能体让模型学会“看哪里、怎么看”

上海创智学院LeapQuest团队联合多所高校提出医学AI新范式,让模型在推理过程中主动调用视觉工具,从被动接收视觉输入变为主动寻找证据。论文被ICML 2026接收。

  • LeapQuest团队提出Ophiuchus和MedScope,分别面向医学图像和视频,采用Think with Images/Videos范式。
  • Ophiuchus-7B在8个VQA benchmark上平均得分68.0,超越o3(62.2)、GPT-5(59.9)。
站内正文

当产品开始思考:应对AI产品转变

本文探讨了AI如何引发数字产品设计的范式转变,从传统的命令驱动交互转向意图驱动交互,并分析了这种转变在产品管理、用户体验、决策逻辑、发布周期、风险和价值创造等方面带来的新挑战。

  • AI代表了自命令行界面和图形用户界面之后的第三种交互范式,从确定性输出转向概率性输出。
  • 产品团队需要重新思考从发现到交付的全过程,数据策略和模型性能变得与功能同等重要。
站内正文

AI正在重写软件行业?8岁孩子做操作系统,一人公司拿下千万订单

百度秒哒产品总经理朱广翔在2026中国AIGC产业峰会上分享,AI将编程门槛从写代码降低到聊天,87%不懂代码的用户通过秒哒创建应用。8岁小孩做出操作系统,一人公司(OPC)靠项目经理拿下千万订单,石油工程师替代140万采购平台。Vibe Coding让需求方变成供给方,实现大众创业。

  • 第四次编程革命:自然语言编程,门槛降至最低,创造者数量爆发
  • 秒哒用户87%不懂代码,OPC成最大群体,16%创业者
站内正文

ElevenLabs Music v2 实现歌剧至金属无缝过渡,音乐连贯性不减

ElevenLabs 发布了升级版 AI 音乐生成模型 Music v2,支持在单首歌曲中无缝切换歌剧、重金属和说唱等流派。新增的修复功能允许用户在不影响其他部分的情况下重新生成特定段落。

  • Music v2 可在同一首歌内无缝切换不同音乐流派。
  • 新增修复功能支持定向重生成特定段落。
站内正文

[AINews] Cognition融资10亿美元,D轮估值260亿

Cognition在D轮融资中筹集10亿美元,估值达260亿美元,年经常性收入(ARR)预计年底突破10亿美元。文章还涵盖了推理效率优化、智能体工程、持续学习、新基准测试、模型发布以及编码代理产品化等AI领域的最新进展。

  • Cognition完成10亿美元D轮融资,估值260亿美元,ARR预计年底超10亿美元。
  • 推理优化转向架构层面:EAGLE 3.1、DeepSeek V4-Pro混合注意力、小米MiMo缓存管理等。
站内正文

AIhub五月摘要:2026年5月——科学中的AI、彩票假说与世界模型

本月AIhub月刊涵盖科学中的AI会议、彩票假说访谈、世界模型讨论、透明可信AI研究、基础模型影响报告、AIES会议反思、机器人咖啡馆、ACL论文拒稿政策、arXiv反AI垃圾政策等。

  • 专访Ximing Wen:透明且可信的AI系统研究
  • Jonathan Frankle讨论彩票假说与实证主义
站内正文

教宗领悟人工智能的局限性

梵蒂冈新通谕《伟大的人性》捍卫人类不完美作为尊严的来源,并警告将核心人类能力外包给AI的风险,反驳硅谷对人类局限性的轻视。

  • 教宗良十四世的通谕《伟大的人性》肯定人类有限性作为美与尊严的源泉。
  • 文件警告AI参与道德决策,将权力集中于科技精英手中。
站内正文

前谷歌和苹果研究员创立初创公司,为AI打造缺失的“反馈流”

一群前谷歌DeepMind、苹果、OpenAI和Meta的研究员成立了新创公司Trajectory,旨在帮助企业通过真实用户交互持续改进AI产品。Trajectory旨在构建一个平台,让AI能够在部署后持续学习,而不是在训练完成后停滞不前。该公司已获得1500万美元种子轮融资,估值1.15亿美元,由Conviction领投。其CEO Ronak Malde表示,AI编程产品如Cursor已在实践早期版本的持续学习,Trajectory希望将类似技术扩展到更多领域。

  • Trajectory由前谷歌DeepMind、苹果、OpenAI和Meta的研究员创立,旨在实现AI的持续学习。
  • 公司已融资1500万美元,估值1.15亿美元,投资者包括Jeff Dean和Fei-Fei Li。
站内正文

像大自然一样思考、探索AI无法企及领域的“尤里卡”机器

多机构团队研发出一款结合量子隧穿物理与大脑启发架构的神经形态计算机,能够高效解决组合优化问题,如物流网络、芯片布线等,并保证渐近收敛到最优解。该研究发表在《自然·通讯》上,标志着量子启发计算的新方向。

  • 神经形态计算机结合量子隧穿和大脑启发架构,解决组合优化难题
  • 基于CMOS技术,采用Fowler-Nordheim退火器的自编码器架构
站内正文

不要将构建的乐趣交给人工智能

文章提醒开发者,虽然AI可以加速编程,但过度依赖AI可能会剥夺构建过程中的乐趣,如寻找优雅解决方案、设计清洁架构和获取用户反馈等。

  • AI加快了代码编写速度,但可能让开发者失去解决问题的乐趣。
  • 构建过程中的关键体验(如设计架构、发布产品)难以被AI替代。
站内正文

Robinhood 推出智能代理交易功能

Robinhood 推出 Agentic Trading,用户可连接 AI 代理来自动化交易和信用卡购买,并配备安全控制和实时活动监控。

  • 用户可将自己的 AI 代理连接到 Robinhood
  • 支持自动交易和信用卡购买
站内正文

Show HN: BetterCallClaude – 意大利开源AI法律代理

BetterCallClaude 是一个专为意大利法律专业人士设计的开源AI法律代理平台。它提供20个专业化AI代理,覆盖意大利所有20个地区,支持双语(意大利语和英语),并注重隐私保护,符合GDPR和意大利数据保护法。该平台可加速法律研究,提高效率,并保持完全透明和开源。

  • 20个覆盖意大利不同法律领域的AI代理
  • 支持意大利语和英语双语
站内正文

「斯隆奖」得主戴亮全职加盟复旦

斯隆奖得主、UC Berkeley物理系助理教授戴亮加盟复旦大学,出任物理学系、天文与天体物理研究中心教授。复旦近年引进多名顶尖人才,包括苏昊、袁峰、季索清等。

  • 戴亮(2021年斯隆奖得主)全职加入复旦大学
  • 曾在UC Berkeley任助理教授,北大物理系校友
站内正文

清华有了新老师:黄仁勋

黄仁勋受邀加入清华大学经管学院顾问委员会,该委员会由苹果CEO蒂姆·库克担任主席,成员包括马斯克、纳德拉、马云等全球商业领袖。此外,他刚获得卡内基梅隆大学荣誉博士学位,并分享名言“AI不会取代你,但善用AI的人会”。

  • 黄仁勋加入清华大学经管学院顾问委员会
  • 委员会由库克任主席,汇聚全球顶尖企业家
站内正文

AI代理的阿姆达尔定律

本文探讨了AI代理系统中的阿姆达尔定律:系统加速比受人类判断时间占比H的限制。提出了“自清偿式H”概念,即每次人类干预都应产生可重用的工件(如测试用例、规范更新),以减少未来同类干预。强调通过配置化(configurancy)和规范套件将人类知识编码为机器可读形式,从而让代理自主运行。示例包括ElectricSQL的协议变更、Emil Stenström的HTML5解析器、Gas Town的多代理系统以及Ralph Loop的迭代模式。

  • AI代理的加速比上限由人类判断时间占比H决定,H越大加速比越小。
  • 自清偿式H:每次人类干预都应生成可编码的工件,减少未来重复干预。
站内正文

机器人即将迎来ChatGPT时刻吗? – 播客

上个月,在北京半程马拉松中,名为“闪电”的机器人以比人类世界纪录快近七分钟的成绩完赛。这引发人们对机器人是否将像聊天机器人一样进入日常生活的讨论。中国领跑这场变革,政府承诺未来20年投资超1000亿英镑于机器人技术。

  • 机器人“闪电”在北京半程马拉松中击败人类世界纪录。
  • 中国计划投资超1000亿英镑发展机器人技术。
站内正文

模拟信息扩散:面向去中心化多机器人运动规划

本文提出模拟信息扩散(SID)框架,利用约束感知扩散模型(CADM)预测邻居机器人的未来轨迹,从而在每个机器人本地进行安全运动规划。SID仅在高拥堵场景下触发通信,实验表明其在规划有效性和约束满足上优于基线方法,可扩展到108台机器人和160个障碍物的场景。

  • SID通过CADM模拟邻居轨迹,实现去中心化碰撞避免
  • 采用最小通信方案,仅在必要时协调
站内正文

用于行星探测的实时异步单目里程计设计

研究人员提出了一种基于事件的实时异步单目里程计,用于行星漫游车。该方法利用误差状态卡尔曼滤波器处理事件相机数据,在高动态范围光照和计算约束下实现稳健的自我运动估计。

  • 事件相机以微秒分辨率报告异步逐像素亮度变化,适合高速感知和高动态范围环境。
  • 该方法使用误差状态卡尔曼滤波器从事件流中持续估计相机运动。
站内正文

Trinity:利用合成数据统一非结构化户外环境中的类无关地形与语义分割

本文提出了一种基于Transformer的架构Trinity,能够在一个统一网络中同时进行类特定语义分割和类无关地形分割。该方法无需预定义标签或机器人相关的可通行性分数,仅基于视觉外观分割地形区域,从而学习机器人无关的视觉地形先验,可结合机器人特定经验用于下游任务。为了支持大规模训练,研究团队扩展了OAISYS模拟器并推出RUGDSynth合成数据集,同时提供了EXTerra真实世界数据集。实验验证了该方法在复杂户外环境中的有效性。

  • 提出Trinity架构,统一类无关地形分割与语义分割
  • 基于视觉外观而非预定义标签进行地形分割,提升跨平台迁移性
站内正文

面向光流控组装的智能语言到目标合成

研究人员提出了Speak-to-Objective模块化智能管线,利用条件大型语言模型将口头或书面命令转换为可微分的优化目标函数,用于在约束感知逆解算器和实验光流控平台上组装微粒。该方法采用“感知-组合-提议-执行-报告与学习”的循环,将目标作为意图与驱动之间的接口,实现自然语言可编程的微观组装,推动自主光制造平台的发展。

  • Speak-to-Objective管线将自然语言命令转化为可微分的优化目标函数。
  • 该管线在光流控平台上通过激光诱导热粘流实现对微粒图案的组装。
站内正文