AI News HubLIVE

机器人动态

DiscloAI – 开源欧盟AI法案第50条合规SDK

DiscloAI 是一个开源SDK,专为欧盟AI法案第50条合规设计,支持聊天机器人披露、深度伪造标签和AI内容通知。通过CDN或npm可在10分钟内集成,支持24种欧盟语言和WCAG 2.1 AA标准。

  • 开源SDK,用于实现欧盟AI法案第50条透明度要求
  • 功能涵盖聊天机器人交互披露、深度伪造媒体标记和AI生成内容通知
站内正文

Mistral 将 LeChat 更名为 Vibe,押注聊天机器人的未来是全能工作代理

Mistral AI 将其聊天机器人 Le Chat 更名为 Vibe,并将聊天、编程代理和新的工作模式整合在一个品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,独立处理电子邮件、报告或拉取请求等任务。Pro 套餐价格从 17.99 欧元降至 14.99 欧元,但未明确使用限制。此举直接对标 OpenAI、Google 和 Anthropic 的代理型产品。

  • Mistral AI 将聊天机器人 Le Chat 更名为 Vibe,整合聊天、编程代理和工作模式。
  • 工作模式可连接 Google Workspace、Outlook、Slack 或 GitHub,自主处理任务。
站内正文

NBA计划使用AI系统自动判定界外球

NBA总裁亚当·肖华宣布,联盟将引入一套基于AI和摄像头的自动化系统,用于判定界外球等客观裁判决策。该系统类似网球中的鹰眼技术,旨在即时确定球权归属,减少比赛停顿。肖华表示,裁判仍负责涉及接触和犯规的判罚。

  • NBA计划推出AI自动化判罚系统,首先应用于界外球判定。
  • 系统利用场内摄像头和AI技术,类似网球鹰眼,实现即时球权判定。
站内正文

Money Printer Pro —— 开源 AI 内容生成器

Money Printer Pro 是一个基于 Google Gemini 和 VEO 3.1 的开源 AI 内容生成器,可创建逼真的图像和电影级视频,并保持身份一致性。它拥有 7 个视觉引擎、自动批量生成、AI 质量评分和发布把关功能,用户直接向 Google 付费,无需额外订阅。

  • 支持图像和视频生成,包括多镜头视频序列。
  • 身份锁定引擎确保同一人物在不同生成中面部一致。
站内正文

Superpowers:AI编码工作流的代理技能框架

Superpowers是一个为AI编码代理设计的完整软件开发方法论,基于一组可组合的技能和初始指令。它强调测试驱动开发、设计先行、子代理驱动的迭代,并支持多种编码助手(如Claude Code、Codex CLI等)。

  • Superpowers提供一套技能库,包括测试驱动开发、系统调试、协作规划等,使AI代理能自主工作数小时。
  • 工作流程从头脑风暴规范开始,经设计批准后生成实现计划,再通过子代理逐任务执行并审查。
站内正文

教宗领悟人工智能的局限性

梵蒂冈新通谕《伟大的人性》捍卫人类不完美作为尊严的来源,并警告将核心人类能力外包给AI的风险,反驳硅谷对人类局限性的轻视。

  • 教宗良十四世的通谕《伟大的人性》肯定人类有限性作为美与尊严的源泉。
  • 文件警告AI参与道德决策,将权力集中于科技精英手中。
站内正文

用于行星探测的实时异步单目里程计设计

研究人员提出了一种基于事件的实时异步单目里程计,用于行星漫游车。该方法利用误差状态卡尔曼滤波器处理事件相机数据,在高动态范围光照和计算约束下实现稳健的自我运动估计。

  • 事件相机以微秒分辨率报告异步逐像素亮度变化,适合高速感知和高动态范围环境。
  • 该方法使用误差状态卡尔曼滤波器从事件流中持续估计相机运动。
站内正文

Trinity:利用合成数据统一非结构化户外环境中的类无关地形与语义分割

本文提出了一种基于Transformer的架构Trinity,能够在一个统一网络中同时进行类特定语义分割和类无关地形分割。该方法无需预定义标签或机器人相关的可通行性分数,仅基于视觉外观分割地形区域,从而学习机器人无关的视觉地形先验,可结合机器人特定经验用于下游任务。为了支持大规模训练,研究团队扩展了OAISYS模拟器并推出RUGDSynth合成数据集,同时提供了EXTerra真实世界数据集。实验验证了该方法在复杂户外环境中的有效性。

  • 提出Trinity架构,统一类无关地形分割与语义分割
  • 基于视觉外观而非预定义标签进行地形分割,提升跨平台迁移性
站内正文

合成情感与游戏化:探索小型社交机器人不同年龄段的参与策略

许多儿童面临情绪调节和社交互动的挑战,社交辅助机器人需要保持儿童的持续参与。本研究评估了一种触觉机器人的两种参与策略:合成情感反馈和积分奖励。对16名6-8岁小学生的偏好评估显示孩子更喜欢情感参与;而对14名20-27岁大学生的行为研究发现积分奖励系统能带来更高任务准确性(p<0.05)并维持表现。结果表明,不同年龄群体的偏好和行为结果可能不一致,验证设计假设需要通过实际交互观察。

  • 对6-8岁儿童,情感参与优于积分奖励
  • 对20-27岁大学生,积分奖励提高任务准确性和持续性
站内正文

“如果世界”:面向具身场景的通用世界模型因果基准

视频生成模型越来越多地被用作世界模拟器,但现有基准仅评估单视频质量,无法检测模型是否真正理解因果关系。新提出的“如果世界”基准包含319对基于真实场景的提示对,通过改变一个物理变量来测试模型输出的因果一致性。对9个最先进模型的评测显示,最佳配对得分仅52%,开源模型约28%,且表现与视觉显著性相关而非物理可解性。

  • “如果世界”基准由319个提示对组成,每个提示对仅在一个物理变量上不同,旨在检验视频生成模型能否根据物理规律产生正确的差异。
  • 采用APEO评分标准(Adherence、Physics、Environment、Outcome)评估,9个模型中最高得分为52%,开源模型集中在28%左右,所有模型在大量因果干预上失败。
站内正文

超越运动基元:基于头戴式IMU的行为活动识别

本研究提出了一种基于头戴式惯性测量单元(IMU)的行为级活动识别方法,超越了传统运动基元识别。研究团队定义了五种与AR应用需求相匹配的行为类别,构建了包含16万个样本的Ego4D数据集,并提出了HiT-HAR层次模型(70.3万参数),在五类动作和八类场景识别任务上优于现有模型。通过可分离性分析,揭示了头戴式IMU的观测极限:移动类行为可靠可观测,物体转移和任务操作类需要时间上下文,场景依赖信号重叠仍是挑战。结果表明,利用时间上下文和场景结构的架构选择优于简单扩大模型规模。代码和数据集已公开。

  • 提出HiT-HAR层次模型,用于从头戴式IMU进行行为级活动识别,超越简单运动基元
  • 从Ego4D构建16万样本数据集,涵盖8个活动场景和5种行为类别,并采用四层质量保证框架
站内正文

我用这个免费应用深入挖掘Oura Ring数据——发现如下

Simple Wearable Report利用AI从Oura Ring数据中提取更多见解。本文介绍了作者如何使用它,以及它如何与Gemini等AI工具配合提供详细分析。

  • Simple Wearable Report能将Oura数据转化为实验室风格报告,便于医生查看或上传至AI聊天机器人。
  • 与Oura内置AI顾问相比,Gemini等工具提供更具体、量化的数据分析。
站内正文

教皇错在哪里

教皇利奥十四世的AI通谕《伟大的人性》虽然正确指出了算法偏见、水资源使用和数据主权等问题,但未能正视通用人工智能和灾难性风险,缺乏应对大规模失业的具体方案,被批评为过时且令人失望。

  • 教皇利奥十四世的AI通谕《伟大的人性》被批评为过时,未能解决AI时代的关键问题。
  • 通谕虽提及算法偏见、水资源使用等问题,但缺乏对通用人工智能和灾难性风险的讨论。
站内正文

我的眼科医生开错了电脑验光处方,AI帮我修正了

一位患者的验光医生给出了错误且不合适的电脑眼镜处方,导致无法正常使用电脑。借助ChatGPT、Claude和Gemini等AI工具,他重新计算了适配其实际用眼距离的处方,并成功配镜。故事警示患者需与医生充分沟通,同时展示了AI在特定场景下的辅助能力。

  • 医生给患者开具了基于错误距离的电脑眼镜处方,原处方实际为阅读距离。
  • 通过ChatGPT、Claude和Gemini三个AI分析,一致指出问题并给出修正数值。
站内正文

抗击AI爬虫机器人的祸害

LWN的文章讨论了AI爬虫机器人的问题,指出这些自动程序对网站内容造成侵权,并探讨了应对措施。

  • AI爬虫机器人大量抓取网站内容用于训练模型
  • 网站所有者面临带宽消耗和内容被盗用的风险
站内正文

多机器人协作箱体运输:基于角色分散式比例控制的地表适应性方法

本文提出R2P2分散式方法,通过规则分配推、支撑、阻止角色,并采用比例速度控制,实现多机器人协作推动箱体在不同倾斜度和摩擦力的地表(平坦、上坡、下坡)上运输。该方法减少了通信与同步需求,避免单点故障。在NVIDIA IsaacSim仿真中,六机器人团队验证了其在不同地表和箱体质量下的泛化能力,成功率优于传统虚拟领导者-跟随者方法。实际实验中,四台Turtlebot成功移动了1.2千克的箱体。

  • 提出R2P2分散式方法,通过规则分配推、支撑、阻止角色,并采用比例速度控制。
  • 支持不同倾斜度(平坦、上坡、下坡)和摩擦系数的地表,适应不同箱体质量。
站内正文

遥操作中的数据质量闭环:面向高质量示范采集的片段级评估与反馈

遥操作在机器人数据采集中至关重要,但新手操作员常产生虽任务成功但次优的示范。本文提出数据质量评估与反馈(DQAF)框架,通过即时反馈提升示范质量。

  • DQAF框架在每次遥操作后提供基于语义任务进度和遥测的即时反馈。
  • 该框架提取运动平滑度、停滞、运动学极限等信号,生成结构化评估和可操作的自然语言反馈。
站内正文

RCSP:用于安全动态机器人导航的风险敏感推测场景规划

RCSP是一种预测性规划层,通过评估候选命令在短期障碍物未来中的风险来避免机器人的近失承诺问题。在MuJoCo、ROS2/Gazebo和DynaBARN/Jackal模拟中,RCSP提高了安全性和路径质量,但增加了延迟,揭示了其作为现有导航堆栈补充模块的边界。

  • RCSP解决了移动机器人在动态环境中因未来障碍物闭合而失败的问题。
  • 该规划层维护轻量级信念,采样未来交互,并惩罚高风险尾部。
站内正文

利用β-稀疏高斯过程的协作导航与探索

提出了一种新框架,使异构机器人能够在带宽受限下协作导航,通过β-稀疏高斯过程选择地图点并平衡探索与任务相关性,模拟显示路径成本降低18%,信息传输减少76%。

  • 提出β-稀疏高斯过程模型用于任务感知诱导点选择
  • 传感器机器人可在线联合选择传输的地图点和导航动作
站内正文

通过监督投影流形学习实现李群嵌入的神经动力学规划

本文提出李群嵌入动态神经网络(LieEDNN),利用伴随李群作用解决李群与加法运算不兼容及动力学在非线性空间中演化的问题,实现稳定可学习的神经动力学,并在SE(3)上以伸缩机械臂为应用验证。

  • 提出LieEDNN框架,将李群作为流形对称性的内在表示
  • 通过伴随李群作用实现李代数上的加法运算
站内正文

Show HN:Hyper,自动驾驶的公司大脑

Hyper是一款AI驱动的个人知识管理工具,能从Notion、Obsidian等应用中整合上下文,提供智能辅助。创始人此前在Matic从事机器人研发,曾在2020年尝试改进GPT-2未果,如今推出自助版本。

  • Hyper能将个人知识库与AI结合,实现自主工作辅助。
  • 创始人曾尝试GPT-2但时机未成熟,后专注于机器人研发。
站内正文

AgentWatch:通过环境代理实现主动式AWS监控

本文通过实际案例展示了AgentWatch的功能,该解决方案每15分钟执行一次基础设施检查,汇总跨多个AWS账户的CloudWatch指标、日志和告警。代理直接将可操作报告发送到Slack,并响应有关基础设施状态的自然语言查询。同时,探讨了三种人机协同模式,在最大化自动化的同时保持适当监督。

  • AgentWatch是一种环境代理,可主动监控AWS资源,避免被动响应问题。
  • 它每15分钟自动检查基础设施,并通过Slack发送结构化报告。
站内正文

PACT:人机协作中主动询问的持续任务辅助

在长期人机协作中,机器人需要在部分观测下辅助用户,并利用跨天交互历史。然而,协作初期人类特征和惯例未知,被动推断后行动效率低下。为此,本文提出PACT(主动询问持续任务辅助)框架,通过当前观测和累积交互历史评估上下文充分性,决定是否先澄清再行动。实验表明,PACT在辅助准确性和澄清效用上均优于被动基线。

  • 提出PACT框架,使机器人能在必要时主动询问用户以获取澄清,提高辅助可靠性。
  • 使用强化学习实现主要实例,并引入澄清效用指标平衡准确性和询问频率。
站内正文

地形自适应履刺轮:优化行星探测的设计与实验研究

针对行星探测车在不同地形(如斜坡、颗粒状地面)面临的移动挑战,研究者提出了一种能连续调整履刺高度的多模态轮子。在四种代表性表面上的750次试验表明,自适应部署可将滑移率降低30%-58%,在颗粒状地形中旅行时间和能耗最多减少77.4%。结果凸显了固定轮系统的局限性,支持了履刺自适应形态在增强火星车机动性方面的潜力。

  • 提出了一种能连续调整履刺高度的多模态轮子,以适应不同地形
  • 在750次试验中,自适应轮在多种颗粒状地形上显著降低滑移、缩短旅行时间并减少能耗
站内正文

AcroRL:使用双向推力学习激进的四旋翼翻转

本文提出了一种基于强化学习的框架,通过调制恒定参考轨迹实现紧凑、位置受限的四旋翼翻转,并与传统轨迹生成和跟踪兼容。在仿真中,该方法相比最强优化基线,位置均方根误差降低32%,稳定时间减少57%。硬件实验在多种偏航配置下成功翻转,位置均方根误差低于0.35米。

  • 双向推力使四旋翼能够实现倒飞、栖息和传感。
  • 现有方法受限于执行器饱和和电机反转延迟。
站内正文

研究串联弹性驱动改装对黑盒执行器的影响

该研究通过在黑盒执行器上加装定制串联弹性元件,将力控制带宽从10.32 Hz提升至30.32 Hz(提升2.93倍),且性能优于商用传感器7.63%,成本仅25英镑。

  • 设计了一种扭转串联弹性元件,刚度为2155.4 Nm/rad。
  • 改装后开环力控制带宽提升2.93倍。
站内正文

MASt3R-Nav:基于相对三维地图的WayPixel导航

一种名为MASt3R-Nav的新型视觉导航方法,利用像素相对连通性构建几何精确但无需全局一致性的地图,相比传统拓扑图实现更强大的导航能力。

  • 提出像素相对连通图作为新型地图表示。
  • 利用三维基础图像匹配建立图像间的像素对应。
站内正文

实验室测试:这款机器人吸尘器清洁力远超其他,现正打折促销

Ecovacs X8 Pro Omni在ZDNET实验室测试中从10款机器人吸尘器中脱颖而出,获得最佳拾取性能奖。它在地板和地毯上的沙粒拾取平均得分最高,目前正值阵亡将士纪念日周末促销,仅售599美元(优惠67美元)。

  • Ecovacs X8 Pro Omni在ZDNET实验室测试中击败Shark、Roborock等品牌,沙粒拾取平均分达60.28%。
  • 该设备具备自清洁拖布滚轮、清水箱和污水箱,可同时吸尘和拖地。
站内正文

谷歌Deepmind的AlphaProof Nexus仅花几百美元就解决了几十年未解的数学难题

谷歌Deepmind的AlphaProof Nexus系统自主解决了九个开放的爱尔迪什问题,包括两个困扰数学家56年的难题,每个问题的推理成本仅需几百美元。与OpenAI的自然语言方法不同,该系统使用Lean编译器自动验证每一步证明。不过,整体成功率仅为2.5%。

  • AlphaProof Nexus自主解决了九个开放的爱尔迪什问题,其中两个已存在56年。
  • 每个问题的推理成本仅为几百美元。
站内正文

如果你用AI写作,我会找到你并杀了你

作者Sam Kriss以辛辣讽刺的笔触,批判了AI生成内容对真实人类表达的侵蚀。通过寻找餐饮服务商的经历,揭示了AI写作如何制造出空洞、雷同的文本,并指出AI即使进步到能写出好文章,单一化的声音也是一种噩梦。作者强调AI写作本质上是无意义的填充物,容易识别,并警告那些依赖AI写作的人终将被发现。文章还提及AI在解决数学难题上的成就,但认为在人类情感表达领域它无能为力。

  • AI写作空洞雷同,缺乏真实信息与人类声音。
  • 即使AI写作质量提升,单一化语言风格仍是文化噩梦。
站内正文

语义感知引导的无人机探索:用于语言条件3D室内建图

提出SAGE系统,结合CLIP实现开放词汇探索,在保持覆盖的同时优先语义前沿。模拟中物体发现优于FALCON,探索速度比FTU快13.7倍,并在真实飞行中验证。

  • SAGE系统基于FALCON探索器,集成CLIP实现语义感知
  • 在Matterport3D模拟中,SAGE在物体发现上优于FALCON和纯语义方法
站内正文

适用于腿式机器人的四种简单本体感受估计器

论文提出四种利用足地接触减少IMU漂移的腿式机器人状态估计器,包括接触辅助不变扩展卡尔曼滤波器、因子图、固定滞后平滑器等,并已在GTSAM和ROS2中开源实现。

  • 腿式机器人的IMU存在漂移,但足地接触可辅助校正。
  • 开发了四种复杂度递增的状态估计器,从EKF到固定滞后平滑器。
站内正文

联合空间约束下经过验证的任务空间运动规划

研究人员提出一种方法,在关节限制下认证可达笛卡尔步长,在对抗场景中实现零违规和100%目标到达。

  • 标准Bug2规划器在6-11%的步骤中违反关节限制,并在多达18%的场景中无法到达目标。
  • 新方法使用S过程和半定规划来计算认证步长。
站内正文

会问问题的机器人:通过定向解释恢复错位的奖励函数

机器人从演示中学习奖励函数时,演示常常不完善,导致某些重要特征(即任务相关行为方面)未被充分指定,从而在部署时出现行为错位。本文提出一种框架,通过分析演示中特征值的变异性来检测未充分指定的特征(变异小表示指定良好,变异大表示指定不足)。机器人随后用自然语言解释其不确定的特征,并主动请求针对性的纠正演示。在模拟桌面操作和真实Franka机器人用户研究中,定向解释引导的查询显著优于随机查询和被动数据收集。

  • 机器人学习奖励函数时,不完善的演示可能导致重要特征未被充分指定,引发部署时的行为错位。
  • 提出一种检测未充分指定特征的方法:特征在演示中变异小则指定良好,变异大则指定不足。
站内正文

扩展深度事件视觉里程计:稀疏点云导出

事件相机凭借低延迟、高时间分辨率和高动态范围,在高速运动和复杂光照条件下的视觉里程计任务中表现优异。深度事件视觉里程计(DEVO)通过结合稀疏补丁跟踪、学习补丁选择、循环对应优化和可微分光束法平差,实现了强大的单目事件里程计性能。本研究在DEVO基础上添加了稀疏点云导出管道,无需修改核心里程计算法,即可将内部估计的3D结构转换为显式点云表示,支持可视化和后续处理。实验表明,导出的稀疏点云在局部与EMVS重建一致,在5厘米阈值下精度高,但也暴露了密度、完整性和对累积里程计噪声敏感等局限性。

  • 事件相机适用于高速运动和恶劣光照条件下的视觉里程计。
  • DEVO通过稀疏补丁跟踪和可微分光束法平差实现强性能。
站内正文

GEM-4D:用于机器人操作的几何增强视频世界模型

GEM-4D是一种几何增强的视频世界模型,通过注入密集的4D对应监督来提升机器人的操作能力。该模型在训练时从预训练的几何基础模型中提取知识,从而同时捕捉外观和几何结构,且不增加推理成本。此外,引入逆向动力学模块,将一致的视频序列转化为可执行的机器人轨迹。实验显示,GEM-4D在视频预测和几何一致性上达到最优,并将真实世界操作成功率从61%提升至81%。

  • GEM-4D通过密集4D对应监督增强视频世界模型的几何一致性。
  • 该模型保持单流架构,无需额外推理成本。
站内正文

FusionSense:三阶段近传感器学习实现运行时自适应多模态边缘智能

FusionSense是一种面向能源受限自主边缘系统的融合感知智能框架。通过三阶段训练流程(服务器端融合模型学习、滤除安全标签量化模态必要性、注入近传感器预测压缩边缘融合模型),在运行时联合减少计算与通信开销。在SynDrone双模态(RGB+深度/激光雷达)测试中,任务质量保持的同时实现了高达33倍的能量节省(1%感兴趣区域出现率),质量损失减少92.3%。

  • 提出三阶段近传感器学习方法,服务器端训练融合模型后生成滤除安全标签,指导边缘侧模态选择。
  • 运行时决策层联合优化计算与传输,传感器数量扩展时复杂度线性增长。
站内正文

我精选的早期阵亡将士纪念日优惠:笔记本电脑、平板等大幅降价

阵亡将士纪念日周末来临,各大零售商推出家居、户外、科技等多品类优惠。作为ZDNET的购物编辑,我精选了经过测试和推荐的产品折扣,包括苹果、三星、海信、Ninja等品牌的热门商品。

  • 阵亡将士纪念日周末标志着夏季非正式开始,零售商提供各类商品折扣。
  • 作为ZDNET购物编辑,我筛选出最值得关注的优惠,涵盖手机、电视、笔记本电脑等品类。
站内正文

韩国副总理:人工智能创造的财富必须惠及公众

韩国副总理裴京勋表示,人工智能创造的财富必须惠及公众,并表达了对AI可能加剧贫富差距和导致失业的担忧。他提到三星电子最近的劳资冲突是AI时代趋势的一部分,强调需要建设“AI包容性社会”。此外,他对科技股集中上涨和工业机器人应用发表了看法。

  • 韩国副总理裴京勋强调AI财富必须惠及公众,防止不平等加剧。
  • 三星电子近期罢工暂停,劳资冲突被视为AI时代的缩影。
站内正文

佛罗里达州机器人蜂箱声称减少70%的蜂群崩溃

佛罗里达州的一个社区部署了AI驱动的机器人蜂箱,用于监测蜂群健康并保护蜜蜂免受威胁,声称蜂群崩溃率降低了70%,而蜜蜂对大部分作物的授粉至关重要。

  • AI驱动的BeeHome系统在佛罗里达社区安装,用于保护蜂群。
  • 使用摄像头、传感器和机器人技术监测蜂群健康并自动处理威胁。
站内正文

梵蒂冈与Anthropic的意外合作重塑AI伦理辩论

教宗良十四世关于人工智能的新通谕将由Anthropic联合创始人克里斯·奥拉共同发布,引发伦理讨论。梵蒂冈与科技公司的长期接触,以及Anthropic与天主教伦理家的合作,旨在塑造更道德的AI。

  • 教宗良十四世的新通谕聚焦AI,由Anthropic联合创始人克里斯·奥拉协助发布。
  • 梵蒂冈与科技公司的关系可追溯至2016年,教皇方济各曾推动相关对话。
站内正文

我以测试机器人吸尘器为生,这些是现在的阵亡将士纪念日最佳优惠

阵亡将士纪念日周末是购买机器人吸尘器的最佳时机之一,这些优惠能帮您省钱。作为一名评测员,我盘点了目前最值得购买的机器人吸尘器优惠。

  • 阵亡将士纪念日是购买机器人吸尘器的好时机,许多智能家居设备都有大幅折扣。
  • 机器人吸尘器通常是较大投资,消费者需密切关注优惠。
站内正文

雷达可区分昆虫物种

研究人员开发了一种毫米波雷达系统,结合机器学习,通过分析昆虫翅膀拍动产生的微多普勒特征,能够以85%的准确率区分不同传粉昆虫的物种,并且非侵入性地监测它们,有望替代传统的致命昆虫捕捉方法。

  • 新型毫米波雷达系统使用微多普勒信号分析昆虫翅膀运动,实现物种分类。
  • 机器学习模型对五种传粉昆虫的物种分类准确率达85%,科级分类达96%。
站内正文

AI-DECLARATION.md:声明代码中AI使用情况的开源标准

AI-DECLARATION.md 是一个开源规范,通过在仓库中声明AI参与程度来提升透明度。它定义了从无AI到完全自动化的六个等级,并允许针对设计、实现、测试等开发过程进行细化声明。该规范强调以结构化方式明确AI使用情况,旨在建立开发者社区的可信契约。

  • AI-DECLARATION.md 提供结构化声明方式,让项目透明展示AI使用程度
  • 等级从 none 到 auto 分六级,可针对不同过程细化
站内正文

谷歌AI搜索出现严重故障:搜索“忽略”竟回复“收到”

谷歌的AI概述功能近期出现异常,搜索“disregard”等词时,AI会像聊天机器人一样回应而非提供摘要。谷歌已确认问题并正在修复。

  • 搜索“disregard”时,AI概述显示类似聊天机器人的回复。
  • 搜索“ignore”和“skip”也出现类似问题。
站内正文

回顾Google I/O 2026的对话舞台

在今年的I/O大会上,对话舞台汇聚了谷歌领导者、科学家和创意先驱,共同探讨人工智能、量子计算、机器人技术和创造力等领域的突破性进展。

  • 谷歌CEO桑达尔·皮查伊与未来前进创始人马特·伯曼对话,解读I/O重大公告。
  • 谷歌团队与Logan Kilpatrick讨论AI代理如何改变生产力。
站内正文

软体线性气动执行器的解析与实验力分析

本文对一种新型线性软套管执行器(LSSA)进行了解析和实验力分析。建立了准静态模型,通过实验验证了在125 kPa压力下出力随伸长从约112 N降至零,且静态载荷会延迟并减小出力。结果表明LSSA的力生成受压力、几何形状、位移、载荷和轴向刚度的耦合影响。

  • 提出了一种适用于可穿戴机器人的线性软套管执行器(LSSA),并建立了准静态力分析模型。
  • 实验显示在125 kPa下,LSSA出力从零伸长时的约112 N随伸长至40 mm而降至接近零。
站内正文

分布式多覆盖:面向机器人蜂群的鲁棒覆盖算法

本文提出一种用于无人机蜂群的分布式多覆盖算法,无需全局协调,仅依靠局部感知和通信即可确保每个关键资产被多台机器人冗余覆盖,且能应对机器人故障。该工作被ANTS 2026会议录用。

  • 提出分布式多覆盖算法,解决机器人蜂群中因故障导致覆盖失效的问题
  • 算法仅依赖局部感知和通信,无需全局规划,适用于实际部署
站内正文

AVI-HT:自适应视觉-IMU融合三维手部追踪

AVI-HT是一种自适应视觉-IMU融合方法,通过联合建模第一人称视角图像和手套上的6自由度IMU信号实现3D手部姿态追踪。在严重视觉遮挡的手-物交互场景中,AVI-HT显著提升了精度和可用性。其核心在于同步多模态训练数据和跨传感器深度注意力机制。在DexGloveHOI数据集上的实验表明,AVI-HT将平均关键点误差降低了16.1%,手腕对齐变体降低了24.2%。

  • AVI-HT联合视觉和IMU传感器信号,实现高精度3D手部追踪
  • 提出跨传感器深度注意力机制,自适应调整对视觉和IMU的信任度
站内正文

主题导航