银行为何需要首席科学家?
Prem Natarajan离开亚马逊,成为第一资本的首席科学家,将深度AI研究应用于解决大规模现实金融挑战,从欺诈检测到代理客户服务。
- 第一资本将AI视为一门科学学科,而不仅仅是部署的技术。
- 该银行的云优先基础设施支持大规模AI研究。
Media source; summary-only unless authorization is obtained.
Prem Natarajan离开亚马逊,成为第一资本的首席科学家,将深度AI研究应用于解决大规模现实金融挑战,从欺诈检测到代理客户服务。
本文探讨了AI在数学领域的快速发展如何挑战传统数学研究,引发数学家对自身角色的深刻反思,并分析了三种可能的未来:AI作为工具、合作伙伴或自主研究者。
普林斯顿大学研究人员利用强化学习和逆向设计,从头开始快速设计射频集成电路(RFIC),生产出的芯片在创纪录的时间内超越了人类设计的性能。AI生成的非常规布局突破了性能极限,但该领域需要开放数据集以进一步推进。
人工智能自1956年达特茅斯会议正式确立以来,经历了70年的发展,从早期的神经网络、专家系统到现代深度学习、大语言模型和生成式AI。文章回顾了AI的演变历程、优势与风险,并强调了IEEE在推动AI进步与负责任使用方面的贡献。
大型语言模型(LLM)已从研究实验室进入工程师的日常工作流程。为帮助技术人员掌握LLM的构建与部署,IEEE推出了一个包含五门课程、总计可获专业发展学分和数字徽章的在线培训项目。
神经形态计算通过模仿大脑运作,比传统AI芯片更节能。但现有设备连接数量远少于人脑神经元。新研究表明,利用声波(phi-bit)可构建更逼真的神经突触,实现更快运算和更高能效。在鸢尾花分类测试中,声学突触以39个参数达到96.7%准确率,功耗仅为电子神经形态硬件的十分之一,并模拟了神经调节机制。
生成式AI模糊了“使用”的定义,初创公司Sureel和SoundVerse正致力于建立训练数据归属机制,让音乐人在其作品被用于AI训练时获得报酬。这涉及复杂的技术和伦理问题,并在版权诉讼之外开辟了新的行业规范可能性。
研究人员利用视觉语言模型训练协作机器人,通过结合面部表情和情境因素来读取人类情感。实验表明,VLM在情感识别上优于传统AI,个性化道歉虽受欢迎,但无法弥补机器人功能失误带来的信任损失。
谷歌DeepMind的分拆公司Isomorphic Labs利用其新型AI系统IsoDDE发现蛋白质上隐藏的药物结合口袋,超越了AlphaFold。该系统成功预测了cereblon上的隐秘口袋,验证了其发现新药物靶点的能力。
荷兰特温特大学的研究人员通过在每个GPU内核级别调整时钟频率,在几乎不牺牲速度的情况下,将大语言模型训练能耗降低了14%。
冰川消融速度的监测对评估气候变化和预测海平面上升至关重要,但传统人工分析费时费力。德国纽伦堡大学的研究人员开发了一种新方法,通过仅提供每座冰川的一张人工标注图像、夏季无冰碛参考图像和基岩地图,将深度学习模型的冰川锋面追踪误差从超过1公里降至不到70米。该模型已成功应用于挪威斯瓦尔巴群岛的所有145座冰川,生成了2015至2024年的月度锋面位置数据,未来有望扩展到北极其他地区。研究团队表示,这一方法可部分自动化全球冰川监测,只需少量初始标注数据即可适应新区域。
在2026年台北国际电脑展上,Nvidia发布了面向Windows PC的RTX Spark,基于Blackwell GB10超级芯片,并得到微软及多家PC厂商支持。相比2024年Qualcomm的Copilot+ PC,Nvidia凭借其行业影响力和软件生态有望推动Windows on Arm生态发展。RTX Spark集成CPU、GPU和NPU,性能预计接近RTX 5070移动显卡,但功耗更低。Nvidia的软件优势是关键,其GPU市场份额超90%,驱动成熟。微软强调AI能力,但Windows on Arm的真正考验仍是能否成为x86的替代品。
量子计算机有望解决超算无法企及的问题,但其运行离不开大量经典计算支持。随着量子比特数量增加,校准和纠错等经典任务的基础设施创新至关重要。NVIDIA、Q-CTRL、IBM、Riverlane、Google等公司正在开发相关软硬件。
随着AI系统能力提升,大量资源用于衡量AI性能,但对其对人类认知、关系和行为的影响却缺乏系统测量。人道技术中心的Imran Khan指出,AI可能重塑人类基本能力,而当前评估体系忽视了最关键的指标——人类福祉。文章讨论了AI在社交、教育、情感支持等领域的潜在危害,并呼吁长期研究、数据共享和监管改革。
AI硬件初创公司Majestic Labs正在开发一种名为Prometheus的新型AI服务器,配备高达128TB的内存,是Nvidia DGX B300服务器的60倍以上。该服务器采用DRAM中心架构,使用专有微型铜缆内存接口和自定义内存聚合芯片,提供高达25.6TB/s的带宽。它包含12个Ignite AI处理器,结合ARM和RISC-V核心,支持PyTorch、vLLM和Triton框架,无需修改代码。预计2027年发货,声称可将资本支出和功耗降低10至50倍。
本文由一位拥有近三十年经验的应用型芯片(ASIC)设计师撰写,他经历了从学术界到工业界的转型。文章深入探讨了芯片设计在学术与工业环境中的根本差异,包括目标、风险承受能力、验证标准和时间规划等方面,并强调了硅知识产权(IP)在工业界的重要性。随着ASIC市场的快速增长,行业需要更多设计师,但来自学术背景的人必须了解这些关键区别。
南非拥有全球88%的铂族金属储量,是非洲最大的数据中心市场,并处于中美AI基础设施竞争的前沿。然而,其AI政策草案因包含AI幻觉引用而被撤回,未能利用这些优势来谈判有利条件。文章分析了南非的结构性杠杆、三种潜在的AI基础设施未来(中国、美国和本地开放权重),以及制定具有约束力的治理框架的必要性。
本次网络研讨会展示了一种在单一环境中设计、训练、验证、压缩和部署基于AI的虚拟传感器模型到嵌入式处理器的工作流程。通过实际案例,演示如何将AI模型集成到系统级设计中,并针对性能、资源和部署约束进行验证。
研究人员开发了一种毫米波雷达系统,结合机器学习,通过分析昆虫翅膀拍动产生的微多普勒特征,能够以85%的准确率区分不同传粉昆虫的物种,并且非侵入性地监测它们,有望替代传统的致命昆虫捕捉方法。
新西兰怀卡托大学的研究人员开发了一种针对毛利语方言的文本转语音模型,强调数据主权和社区所有权。该模型使用开源工具和少量数据,实现了6.78%的词错误率,旨在为其他少数民族语言社区提供可复制的蓝图。
开源运动正将AI的突破性进展引入机器人领域,降低开发门槛。从ROS框架到英伟达、Hugging Face和阿里巴巴的开源模型,机器人推理、决策和行动的能力正变得对更多人可用。但商业激励与学术初心之间的张力也带来新挑战。
Wetour Robotics认为,物理AI的下一个前沿不是更智能的机器人,而是将人体视为计算网络中的一流节点的更智能界面。其空间意图融合平台Orchestra结合空间位置、视觉背景和手势意图,实现低延迟、免提控制连接设备。系统使用边缘AI和表面肌电信号(sEMG)进行动作前意图感知,解决了传统界面在现实场景中的失效问题。文章讨论了其架构、权衡及对领域的影响。
本演讲重点介绍约翰·霍普金斯大学应用物理实验室在推进协作机器人团队自主AI方面的最新成果。从异构系统自主性、协调性和适应性的核心挑战出发,介绍一个为多机器人环境中自主行为设计的可扩展架构,并总结关键挑战和实际经验。
墨尔本正通过主权AI计算、超大规模数据中心和国际会议的结合,构建一个加速研究创新的飞轮。MAVERIC超级计算机、CDC和NEXTDC的数据中心投资,以及一系列研究会议,共同巩固了墨尔本作为全球AI研究中心的地位。
研究显示,通过人耳无法察觉的音频信号可以劫持AI语音系统,成功率高达96%。这种名为AudioHijack的攻击针对大型音频语言模型(LALM),可引发多种恶意行为,包括数据窃取和未经授权的工具使用。
韩国研究人员开发了一套无线电子戒指,结合深度学习系统,能够将手语翻译成文本。该系统使用七枚戒指,每枚戒指配备加速度计,可检测手部运动,并无线传输数据。在实验中,它能以88.3%和88.5%的准确率识别100个常见美国手语和国际手语词汇,并能翻译连续句子。未来计划包括集成面部表情和身体姿态,以及实现手机端处理。
德克萨斯大学奥斯汀分校的研究人员开发了一种石墨烯“纹身”,可以直接贴在植物叶片上实时监测水分含量。该传感器不仅可用于监测植物健康状况,还能充当人工突触,未来有望构建植物的神经网络,实现森林火灾和干旱风险的实时评估。
一项发表在《科学》杂志上的新研究表明,OpenAI的大型语言模型在临床推理任务上表现优于医生,但也引发了关于可靠性、评估标准和对医疗实践影响的讨论。
通用大型语言模型在转录历史手写文字方面展现出日益强大的能力,在准确性、速度和成本上超越了Transkribus等专用工具,使得以往难以访问的档案资料变得可检索。
随着AI工作负载达到千兆级规模,数据中心行业面临电力链的动态韧性瓶颈。GPU集群产生的高频脉冲负载可导致电压暂降和频率不稳,传统备用电源无法应对毫秒级波动。Ampace与伊顿合作,通过半固态电池技术和先进UPS系统,将储能从被动备份转变为主动高速稳定器,解决AI时代的电力悖论。