DiscloAI – 开源欧盟AI法案第50条合规SDK
DiscloAI 是一个开源SDK,专为欧盟AI法案第50条合规设计,支持聊天机器人披露、深度伪造标签和AI内容通知。通过CDN或npm可在10分钟内集成,支持24种欧盟语言和WCAG 2.1 AA标准。
- 开源SDK,用于实现欧盟AI法案第50条透明度要求
- 功能涵盖聊天机器人交互披露、深度伪造媒体标记和AI生成内容通知
主题流
机器人模型、具身智能、自动驾驶与硬件系统。
DiscloAI 是一个开源SDK,专为欧盟AI法案第50条合规设计,支持聊天机器人披露、深度伪造标签和AI内容通知。通过CDN或npm可在10分钟内集成,支持24种欧盟语言和WCAG 2.1 AA标准。
Mistral AI 将其聊天机器人 Le Chat 更名为 Vibe,并将聊天、编程代理和新的工作模式整合在一个品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,独立处理电子邮件、报告或拉取请求等任务。Pro 套餐价格从 17.99 欧元降至 14.99 欧元,但未明确使用限制。此举直接对标 OpenAI、Google 和 Anthropic 的代理型产品。
NBA总裁亚当·肖华宣布,联盟将引入一套基于AI和摄像头的自动化系统,用于判定界外球等客观裁判决策。该系统类似网球中的鹰眼技术,旨在即时确定球权归属,减少比赛停顿。肖华表示,裁判仍负责涉及接触和犯规的判罚。
Money Printer Pro 是一个基于 Google Gemini 和 VEO 3.1 的开源 AI 内容生成器,可创建逼真的图像和电影级视频,并保持身份一致性。它拥有 7 个视觉引擎、自动批量生成、AI 质量评分和发布把关功能,用户直接向 Google 付费,无需额外订阅。
Superpowers是一个为AI编码代理设计的完整软件开发方法论,基于一组可组合的技能和初始指令。它强调测试驱动开发、设计先行、子代理驱动的迭代,并支持多种编码助手(如Claude Code、Codex CLI等)。
梵蒂冈新通谕《伟大的人性》捍卫人类不完美作为尊严的来源,并警告将核心人类能力外包给AI的风险,反驳硅谷对人类局限性的轻视。
研究人员提出了一种基于事件的实时异步单目里程计,用于行星漫游车。该方法利用误差状态卡尔曼滤波器处理事件相机数据,在高动态范围光照和计算约束下实现稳健的自我运动估计。
本文提出了一种基于Transformer的架构Trinity,能够在一个统一网络中同时进行类特定语义分割和类无关地形分割。该方法无需预定义标签或机器人相关的可通行性分数,仅基于视觉外观分割地形区域,从而学习机器人无关的视觉地形先验,可结合机器人特定经验用于下游任务。为了支持大规模训练,研究团队扩展了OAISYS模拟器并推出RUGDSynth合成数据集,同时提供了EXTerra真实世界数据集。实验验证了该方法在复杂户外环境中的有效性。
许多儿童面临情绪调节和社交互动的挑战,社交辅助机器人需要保持儿童的持续参与。本研究评估了一种触觉机器人的两种参与策略:合成情感反馈和积分奖励。对16名6-8岁小学生的偏好评估显示孩子更喜欢情感参与;而对14名20-27岁大学生的行为研究发现积分奖励系统能带来更高任务准确性(p<0.05)并维持表现。结果表明,不同年龄群体的偏好和行为结果可能不一致,验证设计假设需要通过实际交互观察。
视频生成模型越来越多地被用作世界模拟器,但现有基准仅评估单视频质量,无法检测模型是否真正理解因果关系。新提出的“如果世界”基准包含319对基于真实场景的提示对,通过改变一个物理变量来测试模型输出的因果一致性。对9个最先进模型的评测显示,最佳配对得分仅52%,开源模型约28%,且表现与视觉显著性相关而非物理可解性。
本研究提出了一种基于头戴式惯性测量单元(IMU)的行为级活动识别方法,超越了传统运动基元识别。研究团队定义了五种与AR应用需求相匹配的行为类别,构建了包含16万个样本的Ego4D数据集,并提出了HiT-HAR层次模型(70.3万参数),在五类动作和八类场景识别任务上优于现有模型。通过可分离性分析,揭示了头戴式IMU的观测极限:移动类行为可靠可观测,物体转移和任务操作类需要时间上下文,场景依赖信号重叠仍是挑战。结果表明,利用时间上下文和场景结构的架构选择优于简单扩大模型规模。代码和数据集已公开。
Simple Wearable Report利用AI从Oura Ring数据中提取更多见解。本文介绍了作者如何使用它,以及它如何与Gemini等AI工具配合提供详细分析。
教皇利奥十四世的AI通谕《伟大的人性》虽然正确指出了算法偏见、水资源使用和数据主权等问题,但未能正视通用人工智能和灾难性风险,缺乏应对大规模失业的具体方案,被批评为过时且令人失望。
一位患者的验光医生给出了错误且不合适的电脑眼镜处方,导致无法正常使用电脑。借助ChatGPT、Claude和Gemini等AI工具,他重新计算了适配其实际用眼距离的处方,并成功配镜。故事警示患者需与医生充分沟通,同时展示了AI在特定场景下的辅助能力。
LWN的文章讨论了AI爬虫机器人的问题,指出这些自动程序对网站内容造成侵权,并探讨了应对措施。
本文提出R2P2分散式方法,通过规则分配推、支撑、阻止角色,并采用比例速度控制,实现多机器人协作推动箱体在不同倾斜度和摩擦力的地表(平坦、上坡、下坡)上运输。该方法减少了通信与同步需求,避免单点故障。在NVIDIA IsaacSim仿真中,六机器人团队验证了其在不同地表和箱体质量下的泛化能力,成功率优于传统虚拟领导者-跟随者方法。实际实验中,四台Turtlebot成功移动了1.2千克的箱体。
遥操作在机器人数据采集中至关重要,但新手操作员常产生虽任务成功但次优的示范。本文提出数据质量评估与反馈(DQAF)框架,通过即时反馈提升示范质量。
RCSP是一种预测性规划层,通过评估候选命令在短期障碍物未来中的风险来避免机器人的近失承诺问题。在MuJoCo、ROS2/Gazebo和DynaBARN/Jackal模拟中,RCSP提高了安全性和路径质量,但增加了延迟,揭示了其作为现有导航堆栈补充模块的边界。
提出了一种新框架,使异构机器人能够在带宽受限下协作导航,通过β-稀疏高斯过程选择地图点并平衡探索与任务相关性,模拟显示路径成本降低18%,信息传输减少76%。
本文提出李群嵌入动态神经网络(LieEDNN),利用伴随李群作用解决李群与加法运算不兼容及动力学在非线性空间中演化的问题,实现稳定可学习的神经动力学,并在SE(3)上以伸缩机械臂为应用验证。
Hyper是一款AI驱动的个人知识管理工具,能从Notion、Obsidian等应用中整合上下文,提供智能辅助。创始人此前在Matic从事机器人研发,曾在2020年尝试改进GPT-2未果,如今推出自助版本。
本文通过实际案例展示了AgentWatch的功能,该解决方案每15分钟执行一次基础设施检查,汇总跨多个AWS账户的CloudWatch指标、日志和告警。代理直接将可操作报告发送到Slack,并响应有关基础设施状态的自然语言查询。同时,探讨了三种人机协同模式,在最大化自动化的同时保持适当监督。
BobCA 是一个自主学习编码的智能代理,能够根据用户的偏好进行个性化编程。
在长期人机协作中,机器人需要在部分观测下辅助用户,并利用跨天交互历史。然而,协作初期人类特征和惯例未知,被动推断后行动效率低下。为此,本文提出PACT(主动询问持续任务辅助)框架,通过当前观测和累积交互历史评估上下文充分性,决定是否先澄清再行动。实验表明,PACT在辅助准确性和澄清效用上均优于被动基线。
针对行星探测车在不同地形(如斜坡、颗粒状地面)面临的移动挑战,研究者提出了一种能连续调整履刺高度的多模态轮子。在四种代表性表面上的750次试验表明,自适应部署可将滑移率降低30%-58%,在颗粒状地形中旅行时间和能耗最多减少77.4%。结果凸显了固定轮系统的局限性,支持了履刺自适应形态在增强火星车机动性方面的潜力。
本文提出了一种基于强化学习的框架,通过调制恒定参考轨迹实现紧凑、位置受限的四旋翼翻转,并与传统轨迹生成和跟踪兼容。在仿真中,该方法相比最强优化基线,位置均方根误差降低32%,稳定时间减少57%。硬件实验在多种偏航配置下成功翻转,位置均方根误差低于0.35米。
该研究通过在黑盒执行器上加装定制串联弹性元件,将力控制带宽从10.32 Hz提升至30.32 Hz(提升2.93倍),且性能优于商用传感器7.63%,成本仅25英镑。
一种名为MASt3R-Nav的新型视觉导航方法,利用像素相对连通性构建几何精确但无需全局一致性的地图,相比传统拓扑图实现更强大的导航能力。
Ecovacs X8 Pro Omni在ZDNET实验室测试中从10款机器人吸尘器中脱颖而出,获得最佳拾取性能奖。它在地板和地毯上的沙粒拾取平均得分最高,目前正值阵亡将士纪念日周末促销,仅售599美元(优惠67美元)。
谷歌Deepmind的AlphaProof Nexus系统自主解决了九个开放的爱尔迪什问题,包括两个困扰数学家56年的难题,每个问题的推理成本仅需几百美元。与OpenAI的自然语言方法不同,该系统使用Lean编译器自动验证每一步证明。不过,整体成功率仅为2.5%。
作者Sam Kriss以辛辣讽刺的笔触,批判了AI生成内容对真实人类表达的侵蚀。通过寻找餐饮服务商的经历,揭示了AI写作如何制造出空洞、雷同的文本,并指出AI即使进步到能写出好文章,单一化的声音也是一种噩梦。作者强调AI写作本质上是无意义的填充物,容易识别,并警告那些依赖AI写作的人终将被发现。文章还提及AI在解决数学难题上的成就,但认为在人类情感表达领域它无能为力。
提出SAGE系统,结合CLIP实现开放词汇探索,在保持覆盖的同时优先语义前沿。模拟中物体发现优于FALCON,探索速度比FTU快13.7倍,并在真实飞行中验证。
论文提出四种利用足地接触减少IMU漂移的腿式机器人状态估计器,包括接触辅助不变扩展卡尔曼滤波器、因子图、固定滞后平滑器等,并已在GTSAM和ROS2中开源实现。
研究人员提出一种方法,在关节限制下认证可达笛卡尔步长,在对抗场景中实现零违规和100%目标到达。
机器人从演示中学习奖励函数时,演示常常不完善,导致某些重要特征(即任务相关行为方面)未被充分指定,从而在部署时出现行为错位。本文提出一种框架,通过分析演示中特征值的变异性来检测未充分指定的特征(变异小表示指定良好,变异大表示指定不足)。机器人随后用自然语言解释其不确定的特征,并主动请求针对性的纠正演示。在模拟桌面操作和真实Franka机器人用户研究中,定向解释引导的查询显著优于随机查询和被动数据收集。
事件相机凭借低延迟、高时间分辨率和高动态范围,在高速运动和复杂光照条件下的视觉里程计任务中表现优异。深度事件视觉里程计(DEVO)通过结合稀疏补丁跟踪、学习补丁选择、循环对应优化和可微分光束法平差,实现了强大的单目事件里程计性能。本研究在DEVO基础上添加了稀疏点云导出管道,无需修改核心里程计算法,即可将内部估计的3D结构转换为显式点云表示,支持可视化和后续处理。实验表明,导出的稀疏点云在局部与EMVS重建一致,在5厘米阈值下精度高,但也暴露了密度、完整性和对累积里程计噪声敏感等局限性。
GEM-4D是一种几何增强的视频世界模型,通过注入密集的4D对应监督来提升机器人的操作能力。该模型在训练时从预训练的几何基础模型中提取知识,从而同时捕捉外观和几何结构,且不增加推理成本。此外,引入逆向动力学模块,将一致的视频序列转化为可执行的机器人轨迹。实验显示,GEM-4D在视频预测和几何一致性上达到最优,并将真实世界操作成功率从61%提升至81%。
FusionSense是一种面向能源受限自主边缘系统的融合感知智能框架。通过三阶段训练流程(服务器端融合模型学习、滤除安全标签量化模态必要性、注入近传感器预测压缩边缘融合模型),在运行时联合减少计算与通信开销。在SynDrone双模态(RGB+深度/激光雷达)测试中,任务质量保持的同时实现了高达33倍的能量节省(1%感兴趣区域出现率),质量损失减少92.3%。
阵亡将士纪念日周末来临,各大零售商推出家居、户外、科技等多品类优惠。作为ZDNET的购物编辑,我精选了经过测试和推荐的产品折扣,包括苹果、三星、海信、Ninja等品牌的热门商品。
韩国副总理裴京勋表示,人工智能创造的财富必须惠及公众,并表达了对AI可能加剧贫富差距和导致失业的担忧。他提到三星电子最近的劳资冲突是AI时代趋势的一部分,强调需要建设“AI包容性社会”。此外,他对科技股集中上涨和工业机器人应用发表了看法。
佛罗里达州的一个社区部署了AI驱动的机器人蜂箱,用于监测蜂群健康并保护蜜蜂免受威胁,声称蜂群崩溃率降低了70%,而蜜蜂对大部分作物的授粉至关重要。
教宗良十四世关于人工智能的新通谕将由Anthropic联合创始人克里斯·奥拉共同发布,引发伦理讨论。梵蒂冈与科技公司的长期接触,以及Anthropic与天主教伦理家的合作,旨在塑造更道德的AI。
阵亡将士纪念日周末是购买机器人吸尘器的最佳时机之一,这些优惠能帮您省钱。作为一名评测员,我盘点了目前最值得购买的机器人吸尘器优惠。
研究人员开发了一种毫米波雷达系统,结合机器学习,通过分析昆虫翅膀拍动产生的微多普勒特征,能够以85%的准确率区分不同传粉昆虫的物种,并且非侵入性地监测它们,有望替代传统的致命昆虫捕捉方法。
AI-DECLARATION.md 是一个开源规范,通过在仓库中声明AI参与程度来提升透明度。它定义了从无AI到完全自动化的六个等级,并允许针对设计、实现、测试等开发过程进行细化声明。该规范强调以结构化方式明确AI使用情况,旨在建立开发者社区的可信契约。
谷歌的AI概述功能近期出现异常,搜索“disregard”等词时,AI会像聊天机器人一样回应而非提供摘要。谷歌已确认问题并正在修复。
在今年的I/O大会上,对话舞台汇聚了谷歌领导者、科学家和创意先驱,共同探讨人工智能、量子计算、机器人技术和创造力等领域的突破性进展。
本文对一种新型线性软套管执行器(LSSA)进行了解析和实验力分析。建立了准静态模型,通过实验验证了在125 kPa压力下出力随伸长从约112 N降至零,且静态载荷会延迟并减小出力。结果表明LSSA的力生成受压力、几何形状、位移、载荷和轴向刚度的耦合影响。
本文提出一种用于无人机蜂群的分布式多覆盖算法,无需全局协调,仅依靠局部感知和通信即可确保每个关键资产被多台机器人冗余覆盖,且能应对机器人故障。该工作被ANTS 2026会议录用。
AVI-HT是一种自适应视觉-IMU融合方法,通过联合建模第一人称视角图像和手套上的6自由度IMU信号实现3D手部姿态追踪。在严重视觉遮挡的手-物交互场景中,AVI-HT显著提升了精度和可用性。其核心在于同步多模态训练数据和跨传感器深度注意力机制。在DexGloveHOI数据集上的实验表明,AVI-HT将平均关键点误差降低了16.1%,手腕对齐变体降低了24.2%。