AI News HubLIVE
公开文章 44采集文章 51可信度 82刷新频率 30 分钟
健康状态 健康来源类型 媒体原文权限 站内改写最近入库 2026-06-25ID ieee-spectrum-ai运行状态 已启用

Media source; summary-only unless authorization is obtained.

最新公开文章

银行为何需要首席科学家?

Prem Natarajan离开亚马逊,成为第一资本的首席科学家,将深度AI研究应用于解决大规模现实金融挑战,从欺诈检测到代理客户服务。

  • 第一资本将AI视为一门科学学科,而不仅仅是部署的技术。
  • 该银行的云优先基础设施支持大规模AI研究。
站内正文

当AI能完成数学计算时,成为数学家意味着什么

本文探讨了AI在数学领域的快速发展如何挑战传统数学研究,引发数学家对自身角色的深刻反思,并分析了三种可能的未来:AI作为工具、合作伙伴或自主研究者。

  • AI在数学奥林匹克中达到金牌水平,并能自主产出博士级研究
  • 数学家对AI取代人类感到存在危机,但也在积极讨论未来角色
站内正文

AI正在设计人类无法想象的无线电芯片

普林斯顿大学研究人员利用强化学习和逆向设计,从头开始快速设计射频集成电路(RFIC),生产出的芯片在创纪录的时间内超越了人类设计的性能。AI生成的非常规布局突破了性能极限,但该领域需要开放数据集以进一步推进。

  • RFIC设计是一门复杂的“黑魔法”,依赖人类直觉和多年经验。
  • AI使用强化学习和逆向设计,可快速从头创建RFIC,实现创纪录性能。
站内正文

纪念人工智能70周年

人工智能自1956年达特茅斯会议正式确立以来,经历了70年的发展,从早期的神经网络、专家系统到现代深度学习、大语言模型和生成式AI。文章回顾了AI的演变历程、优势与风险,并强调了IEEE在推动AI进步与负责任使用方面的贡献。

  • AI作为独立学科于1956年正式确立,但其思想根源可追溯至更早。
  • AI发展经历了多次“寒冬”与“春天”,近年来深度学习和生成式AI带来新突破。
站内正文

IEEE推出大型语言模型虚拟培训课程

大型语言模型(LLM)已从研究实验室进入工程师的日常工作流程。为帮助技术人员掌握LLM的构建与部署,IEEE推出了一个包含五门课程、总计可获专业发展学分和数字徽章的在线培训项目。

  • LLM市场预计到2030年每年增长约33%,掌握LLM实现与安全正成为技术人员的核心要求。
  • 工程师需要理解Transformer架构和自注意力机制,而非将LLM视为简单的对话机器人。
站内正文

声波为神经形态芯片带来模拟大脑的优势

神经形态计算通过模仿大脑运作,比传统AI芯片更节能。但现有设备连接数量远少于人脑神经元。新研究表明,利用声波(phi-bit)可构建更逼真的神经突触,实现更快运算和更高能效。在鸢尾花分类测试中,声学突触以39个参数达到96.7%准确率,功耗仅为电子神经形态硬件的十分之一,并模拟了神经调节机制。

  • 声波神经形态设备利用phi-bit实现并行计算,模拟生物突触可塑性
  • 在鸢尾花分类任务中达到96.7%准确率,功耗降低90%
站内正文

音乐人如何因训练AI而获得报酬

生成式AI模糊了“使用”的定义,初创公司Sureel和SoundVerse正致力于建立训练数据归属机制,让音乐人在其作品被用于AI训练时获得报酬。这涉及复杂的技术和伦理问题,并在版权诉讼之外开辟了新的行业规范可能性。

  • 生成式AI使音乐训练数据的“使用”定义复杂化,传统按使用次数付费的模式面临挑战。
  • Sureel与STIM合作,通过标记媒体文件并跟踪AI训练使用情况来设置许可费。
站内正文

视觉语言模型训练机器人读取人类情感

研究人员利用视觉语言模型训练协作机器人,通过结合面部表情和情境因素来读取人类情感。实验表明,VLM在情感识别上优于传统AI,个性化道歉虽受欢迎,但无法弥补机器人功能失误带来的信任损失。

  • VLM在情感识别上得分0.86,优于传统AI的0.77
  • 40名志愿者中31人更喜欢情感自适应道歉
站内正文

谷歌DeepMind分拆公司如何追踪隐藏的药物靶点

谷歌DeepMind的分拆公司Isomorphic Labs利用其新型AI系统IsoDDE发现蛋白质上隐藏的药物结合口袋,超越了AlphaFold。该系统成功预测了cereblon上的隐秘口袋,验证了其发现新药物靶点的能力。

  • IsoDDE超越了AlphaFold,不仅预测结构,还能预测蛋白质-配体相互作用。
  • 该系统仅使用蛋白质序列就准确预测了《自然》杂志发表的cereblon隐秘口袋的位置。
站内正文

定时技巧可将LLM训练能耗降低14%

荷兰特温特大学的研究人员通过在每个GPU内核级别调整时钟频率,在几乎不牺牲速度的情况下,将大语言模型训练能耗降低了14%。

  • 研究人员在GPU每个内核级别应用动态电压频率调整(DVFS)。
  • 实现了14%的能耗节省,训练时间仅增加0.6%。
站内正文

人工智能助力追踪全球冰川消融

冰川消融速度的监测对评估气候变化和预测海平面上升至关重要,但传统人工分析费时费力。德国纽伦堡大学的研究人员开发了一种新方法,通过仅提供每座冰川的一张人工标注图像、夏季无冰碛参考图像和基岩地图,将深度学习模型的冰川锋面追踪误差从超过1公里降至不到70米。该模型已成功应用于挪威斯瓦尔巴群岛的所有145座冰川,生成了2015至2024年的月度锋面位置数据,未来有望扩展到北极其他地区。研究团队表示,这一方法可部分自动化全球冰川监测,只需少量初始标注数据即可适应新区域。

  • 新方法仅需少量额外数据即可将AI冰川锋面追踪误差从超1公里降至不到70米。
  • 通过提供夏季参考图像和基岩地图,模型准确率显著提升。
站内正文

Nvidia的AI硬件通过RTX Spark PC进入Windows

在2026年台北国际电脑展上,Nvidia发布了面向Windows PC的RTX Spark,基于Blackwell GB10超级芯片,并得到微软及多家PC厂商支持。相比2024年Qualcomm的Copilot+ PC,Nvidia凭借其行业影响力和软件生态有望推动Windows on Arm生态发展。RTX Spark集成CPU、GPU和NPU,性能预计接近RTX 5070移动显卡,但功耗更低。Nvidia的软件优势是关键,其GPU市场份额超90%,驱动成熟。微软强调AI能力,但Windows on Arm的真正考验仍是能否成为x86的替代品。

  • Nvidia在Computex 2026发布RTX Spark,将Blackwell GB10超级芯片引入Windows PC。
  • 微软及华硕、戴尔、联想等厂商宣布支持RTX Spark的新设备。
站内正文

量子计算机需要哪些经典计算进步?

量子计算机有望解决超算无法企及的问题,但其运行离不开大量经典计算支持。随着量子比特数量增加,校准和纠错等经典任务的基础设施创新至关重要。NVIDIA、Q-CTRL、IBM、Riverlane、Google等公司正在开发相关软硬件。

  • 量子计算机依赖经典计算进行校准和纠错
  • 校准包含“启动”和“运行时”阶段,目前多靠人工且耗时
站内正文

为何不测量AI对人类的影响?

随着AI系统能力提升,大量资源用于衡量AI性能,但对其对人类认知、关系和行为的影响却缺乏系统测量。人道技术中心的Imran Khan指出,AI可能重塑人类基本能力,而当前评估体系忽视了最关键的指标——人类福祉。文章讨论了AI在社交、教育、情感支持等领域的潜在危害,并呼吁长期研究、数据共享和监管改革。

  • AI技术部署迅猛,但对其心理和社会影响的系统测量严重不足
  • 已有青少年自杀、AI精神病等高危案例,但长期社会影响尚未被关注
站内正文

新型服务器有望突破AI的“内存墙”

AI硬件初创公司Majestic Labs正在开发一种名为Prometheus的新型AI服务器,配备高达128TB的内存,是Nvidia DGX B300服务器的60倍以上。该服务器采用DRAM中心架构,使用专有微型铜缆内存接口和自定义内存聚合芯片,提供高达25.6TB/s的带宽。它包含12个Ignite AI处理器,结合ARM和RISC-V核心,支持PyTorch、vLLM和Triton框架,无需修改代码。预计2027年发货,声称可将资本支出和功耗降低10至50倍。

  • Majestic Labs推出Prometheus AI服务器,内存高达128TB,远超Nvidia DGX B300。
  • 采用DRAM中心架构,通过专有铜缆接口和内存聚合芯片实现高带宽。
站内正文

芯片设计师如何在工业界取得成功

本文由一位拥有近三十年经验的应用型芯片(ASIC)设计师撰写,他经历了从学术界到工业界的转型。文章深入探讨了芯片设计在学术与工业环境中的根本差异,包括目标、风险承受能力、验证标准和时间规划等方面,并强调了硅知识产权(IP)在工业界的重要性。随着ASIC市场的快速增长,行业需要更多设计师,但来自学术背景的人必须了解这些关键区别。

  • 学术界追求新颖性和概念验证,而工业界更注重可靠性、可重复性和大规模生产。
  • 工业界通过保守策略、广泛验证和重复使用经过验证的解决方案来最小化风险。
站内正文

南非拥有AI杠杆,但其政策草案将其闲置

南非拥有全球88%的铂族金属储量,是非洲最大的数据中心市场,并处于中美AI基础设施竞争的前沿。然而,其AI政策草案因包含AI幻觉引用而被撤回,未能利用这些优势来谈判有利条件。文章分析了南非的结构性杠杆、三种潜在的AI基础设施未来(中国、美国和本地开放权重),以及制定具有约束力的治理框架的必要性。

  • 南非的铂族金属和可再生能源资源提供了独特的AI杠杆,但政策草案未设定最低投资条款、数据主权或技术转让条件。
  • 中美科技公司(华为和微软等)正在南非争夺AI基础设施控制权,而南非的政策未明确其回报要求。
站内正文

基于模型设计的AI:虚拟传感器建模

本次网络研讨会展示了一种在单一环境中设计、训练、验证、压缩和部署基于AI的虚拟传感器模型到嵌入式处理器的工作流程。通过实际案例,演示如何将AI模型集成到系统级设计中,并针对性能、资源和部署约束进行验证。

  • 将AI模型集成到Simulink中进行系统级仿真和验证
  • 应用形式化验证技术评估神经网络行为
站内正文

雷达可区分昆虫物种

研究人员开发了一种毫米波雷达系统,结合机器学习,通过分析昆虫翅膀拍动产生的微多普勒特征,能够以85%的准确率区分不同传粉昆虫的物种,并且非侵入性地监测它们,有望替代传统的致命昆虫捕捉方法。

  • 新型毫米波雷达系统使用微多普勒信号分析昆虫翅膀运动,实现物种分类。
  • 机器学习模型对五种传粉昆虫的物种分类准确率达85%,科级分类达96%。
站内正文

毛利语文本转语音模型拒绝大科技公司的价值观

新西兰怀卡托大学的研究人员开发了一种针对毛利语方言的文本转语音模型,强调数据主权和社区所有权。该模型使用开源工具和少量数据,实现了6.78%的词错误率,旨在为其他少数民族语言社区提供可复制的蓝图。

  • 怀卡托大学团队开发了毛利语文本转语音模型,注重数据主权和社区所有权。
  • 模型使用开源架构Piper和音素方法,仅用7小时45分钟录音数据。
站内正文

开源软件开始帮助机器人思考

开源运动正将AI的突破性进展引入机器人领域,降低开发门槛。从ROS框架到英伟达、Hugging Face和阿里巴巴的开源模型,机器人推理、决策和行动的能力正变得对更多人可用。但商业激励与学术初心之间的张力也带来新挑战。

  • 开源机器人软件历经数十年发展,ROS框架奠定了基础设施,如今AI模型的开源正推动机器人“大脑”的进化。
  • 英伟达、Hugging Face和阿里巴巴等公司推出开源机器人AI工具和模型,大幅降低进入门槛。
站内正文

物理AI的未来不在于更智能的机器人,而在于更智能的界面

Wetour Robotics认为,物理AI的下一个前沿不是更智能的机器人,而是将人体视为计算网络中的一流节点的更智能界面。其空间意图融合平台Orchestra结合空间位置、视觉背景和手势意图,实现低延迟、免提控制连接设备。系统使用边缘AI和表面肌电信号(sEMG)进行动作前意图感知,解决了传统界面在现实场景中的失效问题。文章讨论了其架构、权衡及对领域的影响。

  • Wetour Robotics的空间意图融合技术整合空间位置、视觉背景和手势意图,实现免提设备控制。
  • 其Orchestra平台使用NVIDIA Jetson Orin Nano Super边缘AI和sEMG,实现亚100毫秒延迟并预测用户意图。
站内正文

面向机器人团队的自主AI

本演讲重点介绍约翰·霍普金斯大学应用物理实验室在推进协作机器人团队自主AI方面的最新成果。从异构系统自主性、协调性和适应性的核心挑战出发,介绍一个为多机器人环境中自主行为设计的可扩展架构,并总结关键挑战和实际经验。

  • 介绍基于LLM的AI智能体
  • 将基于LLM的AI智能体应用于机器人团队的方法
站内正文

墨尔本的AI与数据中心飞轮如何加速研究创新

墨尔本正通过主权AI计算、超大规模数据中心和国际会议的结合,构建一个加速研究创新的飞轮。MAVERIC超级计算机、CDC和NEXTDC的数据中心投资,以及一系列研究会议,共同巩固了墨尔本作为全球AI研究中心的地位。

  • 墨尔本拥有澳大利亚最大的大学AI超级计算机MAVERIC,专注于医学研究等敏感数据处理。
  • CDC和NEXTDC在墨尔本的数据中心投资超过800兆瓦的数字容量,支持大规模AI工作负载。
站内正文

语音AI系统易受隐藏音频攻击

研究显示,通过人耳无法察觉的音频信号可以劫持AI语音系统,成功率高达96%。这种名为AudioHijack的攻击针对大型音频语言模型(LALM),可引发多种恶意行为,包括数据窃取和未经授权的工具使用。

  • AudioHijack利用人耳无法察觉的音频修改操控AI语音模型,平均成功率为79%-96%。
  • 攻击可作用于开放模型及微软、Mistral等商业模型,且能跨场景复用。
站内正文

手指上的AI戒指能翻译手语

韩国研究人员开发了一套无线电子戒指,结合深度学习系统,能够将手语翻译成文本。该系统使用七枚戒指,每枚戒指配备加速度计,可检测手部运动,并无线传输数据。在实验中,它能以88.3%和88.5%的准确率识别100个常见美国手语和国际手语词汇,并能翻译连续句子。未来计划包括集成面部表情和身体姿态,以及实现手机端处理。

  • 七枚无线戒指通过加速度计捕捉手部运动,AI系统将手势翻译成文本。
  • 测试中识别100个ASL和ISL词汇,准确率约88%。
站内正文

石墨烯“纹身”让植物叶片变身传感器,或可构建植物神经网络

德克萨斯大学奥斯汀分校的研究人员开发了一种石墨烯“纹身”,可以直接贴在植物叶片上实时监测水分含量。该传感器不仅可用于监测植物健康状况,还能充当人工突触,未来有望构建植物的神经网络,实现森林火灾和干旱风险的实时评估。

  • 石墨烯贴片可像纹身一样贴在叶片上,通过电脉冲检测水分,实现实时、非破坏性的植物水分监测。
  • 该传感器具有类似突触的特性,能调节电导率并具有短期记忆,可用于构建神经网络。
站内正文

AI聊天机器人能像医生一样推理吗?

一项发表在《科学》杂志上的新研究表明,OpenAI的大型语言模型在临床推理任务上表现优于医生,但也引发了关于可靠性、评估标准和对医疗实践影响的讨论。

  • OpenAI的o1-preview模型在多个临床推理任务上超越医生,包括使用真实急诊记录。
  • 聊天机器人在医疗信息方面存在幻觉、错误引用和不一致等问题。
站内正文

档案管理员借助大型语言模型大规模破译手写文字

通用大型语言模型在转录历史手写文字方面展现出日益强大的能力,在准确性、速度和成本上超越了Transkribus等专用工具,使得以往难以访问的档案资料变得可检索。

  • LLM可将历史手写文字的字符错误率降至2%以下,超越专用软件。
  • 该技术已被历史学家、档案管理员和美联储等机构用于挖掘隐藏数据。
站内正文

化解千兆级问题:如何解决极端AI训练负载的物理电力悖论

随着AI工作负载达到千兆级规模,数据中心行业面临电力链的动态韧性瓶颈。GPU集群产生的高频脉冲负载可导致电压暂降和频率不稳,传统备用电源无法应对毫秒级波动。Ampace与伊顿合作,通过半固态电池技术和先进UPS系统,将储能从被动备份转变为主动高速稳定器,解决AI时代的电力悖论。

  • AI训练负载引发电力链的物理瓶颈,传统电网和备用电源无法响应毫秒级脉冲。
  • Ampace的PU系列半固态电池作为高速“减震器”,通过超低内阻消除功率尖峰。
站内正文

全部来源

IEEE Spectrum AI AI 新闻来源 | AI News Hub