在Pixel上通过冻结的多token预测加速Gemini Nano模型 2026-06-27 02:30 UTC+8 Google研究人员提出了一种方法,将多token预测(MTP)改造到已部署的Gemini Nano v3模型上,无需重新训练主干网络,从而在移动设备上实现更快的推理速度和更低的能耗。该方法在Pixel 9和10系列上已部署,使AI通知摘要和校对等功能速度提升50%以上。
通过冻结的主干网络和轻量级MTP头部,实现了对现有模型的无缝加速,避免了单独草稿模型的内存开销。 零拷贝架构让MTP头部直接利用主模型的KV缓存,减少了130MB内存占用,并消除了草稿预填充延迟。 优化云经济:线性弹性缓存技术 2026-06-25 18:03 UTC+8 谷歌研究人员提出线性弹性缓存,将缓存管理建模为滑雪租赁问题,通过轻量级机器学习动态调整缓存大小,在Spanner生产环境中降低了15.5%内存使用和约5%总拥有成本,同时缓存未命中仅增加5.5%,且对I/O成本影响极小。
线性弹性缓存将内存成本视为连续变量,动态调整缓存大小,而非固定分配。 基于滑雪租赁问题,为每个数据项决定“租用”内存或“购买”未命中代价。 思考即回忆:推理如何解锁大语言模型中的参数化知识 2026-06-25 00:51 UTC+8 Google Research 的研究揭示了一个反直觉的现象:即使对于简单的事实性问题,让大语言模型生成推理链也能提高答案的准确性。研究发现两种机制:计算缓冲(生成额外标记用于潜在计算)和事实启动(生成相关事实以帮助召回正确答案)。
推理帮助模型召回原本无法获取的简单事实,即使无需逐步推理。 机制一:计算缓冲——生成无意义的推理标记也提供额外计算,提升召回。 AI如何帮助用户理解皮肤状况的研究 2026-06-13 01:52 UTC+8 谷歌研究团队发布了两项关于皮肤病AI工具的研究。大型调查显示,AI辅助使用户命名皮肤状况的准确率提高了近三倍,但在决定下一步行动方面仍有挑战。社区定性研究表明,该应用有助于用户和临床医生沟通,92%的临床医生认为其有帮助。
AI辅助使命名准确率从8%提高到23%,提升近三倍。 在决定下一步医疗行动(如家庭疗法还是就医)方面,AI未带来显著改善。 机器学习遗忘审计新框架 2026-06-11 01:34 UTC+8 Google研究人员提出正则化f-散度核检验框架,用于审计机器学习模型的遗忘和隐私保护。该框架自适应选择最优散度度量,能够更敏感地检测数据泄露和遗忘失败,且所需样本更少,调参更少。
传统双样本检验在大规模模型中失效,新框架更灵敏且自适应。 利用f-散度(卡方、KL、曲棍球棒)检测全局和局部数据偏移。 借助 Gemini Enterprise Agent Platform 的智能体 RAG 解锁可靠回答 2026-06-05 19:26 UTC+8 Google Research 与 Google Cloud 合作推出智能体 RAG 框架,通过多智能体工作流将复杂企业查询分解,迭代搜索足够上下文后生成可靠回答。相比标准 RAG,准确性提升高达 34%。
多智能体 RAG 通过规划、重写和路由分解复杂查询 Sufficient Context Agent 确保持续搜索直到上下文完整 通过智能手机摄像头实现被动心脏健康监测 2026-06-05 03:47 UTC+8 谷歌研究人员开发了一种名为PHRM的系统,可在日常使用智能手机时,通过前置摄像头被动测量心率和静息心率。这项发表于《自然》杂志的研究显示,该系统的心率测量平均绝对百分比误差(MAPE)低于10%(与心电图相比),每日静息心率测量平均绝对误差(MAE)低于5次/分钟(与可穿戴设备相比)。系统在来自近700名参与者的超过35万段视频片段上进行了训练,确保肤色均衡代表性。PHRM优于15种领先的远程光电容积描记法(rPPG)模型,是唯一在真实世界条件下对所有肤色均达到准确性标准的模型。
谷歌的PHRM系统利用智能手机前置摄像头,在面部解锁后被动监测心率和静息心率。 在《自然》研究中,PHRM的心率MAPE<10%(vs. ECG),每日静息心率MAE<5 bpm(vs. 可穿戴设备),适用于所有肤色。 创新新时代:Google Research在I/O 2026的展示 2026-05-29 04:58 UTC+8 在2026年Google I/O大会上,Google Research展示了一系列前沿技术,涵盖科学发现、健康、边缘计算和天气预测等领域。推出了Gemini for Science套件(包括ERA和Co-Scientist),加速科学研究;健康方面有Google Health应用、Symptom AI和AMIE系统;Coral NPU推动边缘AI发展;还有极端天气预测模型。这些创新展示了AI如何放大人类的智慧。
Google发布Gemini for Science,内含ERA和Co-Scientist,加速科学发现。 健康领域推出Google Health应用、Symptom AI和AMIE,提升医疗服务质量。 实证研究助手(ERA):从《自然》论文到推动计算发现 2026-05-20 01:52 UTC+8 谷歌开发的实证研究助手(ERA)利用Gemini编写和优化科学代码,今日在《自然》杂志上发表,并通过Google Labs的受信任测试计划推出了计算发现原型。ERA在基因组学、流行病学等多个基准测试中达到专家级表现,并在预测、二氧化碳监测等领域带来实际应用。
ERA是一种AI工具,利用Gemini为科学家编写和优化代码,解决实验中反复测试的难题。 在《自然》杂志发表的论文中,ERA在多个科学领域的基准测试中达到专家级性能。 通过全球合作与开放资源催化科学影响力 2026-05-02 00:37 UTC+8 Google Research 秉持开放科学原则,通过开源软件和开放数据集,与全球科研社区合作,推动基因组学、神经科学、气候、生物多样性、医疗等领域的突破性发现。文章详细介绍了多个工具(如DeepVariant、Neuroglancer、Open Buildings、SpeciesNet、HAI-DEF)及其实际应用案例,展示了开放科学如何赋能全球研究人员并产生积极社会影响。
Google Research 通过与全球多家机构合作,释放开放科学的力量。 开源工具和数据集已赋能超过25万研究人员,涵盖基因组学、神经科学、气候、生物多样性和医疗健康。 谷歌研究科学家使用实证研究辅助的四种方式 2026-04-30 05:07 UTC+8 自2025年秋季引入实证研究辅助(ERA)以来,谷歌研究科学家已将其应用于流行病学、宇宙学、大气监测和神经科学等领域的实际场景,展示了AI加速科学发现的变革能力。
ERA在流感、COVID-19和RSV住院预测中达到或超过CDC工具的准确性。 ERA结合Gemini Deep Think解决了宇宙弦引力辐射的未解问题。 关键在于角度:重新构图你的照片 2026-04-23 01:00 UTC+8 Google Photos 的 Auto frame 功能利用机器学习模型将照片视为 3D 场景,自动调整相机视角,生成全新的照片。该方法分为 3D 场景估计和生成式修补两个阶段,能够修复透视畸变,改善肖像照片。
Google Photos 推出 Auto frame 功能,利用 AI 自动重新构图照片。 该技术将 2D 照片解释为 3D 场景,调整相机角度以生成新视角。 ReasoningBank:让智能体从经验中学习 2026-04-22 00:42 UTC+8 Google Cloud的研究人员提出了ReasoningBank,一种新型智能体记忆框架,能从成功和失败经验中提炼可推广的推理策略,显著提升智能体在复杂任务中的表现和效率。
ReasoningBank从成功和失败经验中提取结构化记忆,包含标题、描述和内容。 通过记忆感知测试时扩展(MaTTS),进一步利用并行和顺序扩展提升性能。 为现实世界设计合成数据集:从第一性原理出发的机制设计与推理 2026-04-16 22:41 UTC+8 谷歌推出Simula框架,将合成数据生成重新定义为数据集层面的机制设计。通过从第一性原理出发的推理式方法,Simula实现了对数据覆盖度、复杂度和质量的精细控制,适用于隐私敏感或数据稀缺的专门领域。
Simula将合成数据生成视为数据集层面的机制设计问题。 框架将生成过程分解为四个可控轴:全局多样化、局部多样化、复杂化和质量检查。 AI生成的合成神经元加速大脑图谱绘制 2026-04-16 20:18 UTC+8 谷歌研究团队开发了MoGen模型,利用AI生成合成神经元形态,用于训练脑图谱重建模型,使重建错误率降低4.4%。在完整小鼠大脑尺度上,这相当于节省157人年的人工校对工作。该成果为加速大规模脑连接组学项目提供了新工具。
MoGen模型通过点云流匹配生成逼真的3D神经元形状,用于增强训练数据。 将10%的合成数据加入PATHFINDER模型训练,减少了4.4%的重建错误,主要降低了合并错误率。 利用生成式AI培养面向未来的技能 2026-04-14 02:15 UTC+8 谷歌研究与纽约大学合作开发了Vantage,这是一个利用生成式AI评估团队合作和批判性思维等面向未来技能的系统。该系统通过AI化身模拟对话,由执行LLM动态引导,评估结果与人类专家高度一致。目前Vantage已在Google Labs开放注册。
Vantage使用生成式AI创建模拟环境,评估学生面向未来的技能。 执行LLM驱动AI化身,在对话中引入特定挑战以收集技能证据。 ConvApparel:衡量并弥合用户模拟器中的真实感差距 2026-04-09 19:22 UTC+8 谷歌研究院发布ConvApparel数据集和评估框架,用于量化LLM用户模拟器的真实感差距,并训练更鲁棒的对话代理。通过双代理数据收集和三支柱验证,研究发现数据驱动模拟器优于提示基础,但真实感差距依然存在。
ConvApparel包含4000多人机对话,通过“好”与“坏”两种代理采集数据。 评估框架包括人口统计对齐、人类相似度评分和反事实验证三支柱。 改善学术工作流程:引入两个AI代理以改进图表制作和同行评审 2026-04-09 04:01 UTC+8 Google Cloud 的研究团队推出了两个创新的 AI 代理:PaperVizAgent 用于自动生成高质量的学术图表,ScholarPeer 用于自动进行严格的学术论文评审。这两个系统通过多代理协作和迭代优化,在各自任务上显著超越了现有基线,为科学研究流程带来了实质性改进。
PaperVizAgent 是一个多代理框架,能够从学术文本自动生成出版就绪的图表,包括方法论示意图和统计图。 ScholarPeer 模拟高级研究员的评审流程,通过上下文获取和主动验证生成深入、基于文献的评审意见。 评估大语言模型行为倾向的对齐性 2026-04-03 16:00 UTC+8 谷歌研究团队提出了一种系统评估框架,将心理学问卷转化为情境判断测试,量化LLM行为倾向与人类共识的对齐程度。对25个模型的测试发现,模型在高共识场景下存在偏差,且在低共识场景中过度自信,未能反映人类观点的多样性。
新框架将心理学问卷转化为情境判断测试,评估LLM在现实场景中的行为倾向。 25个模型在人类高共识场景中表现良好,但在共识较低时过度自信且方向不一。