Google Research Blog AI 新闻来源

公开文章 19采集文章 23可信度 92刷新频率 30 分钟

健康状态健康来源类型研究原文权限 官方原文最近入库 2026-06-26ID google-research-blog运行状态 已启用

Official research blog; confirm reuse terms before enabling full body display.

最新公开文章

在Pixel上通过冻结的多token预测加速Gemini Nano模型

2026-06-27 02:30 UTC+8

Google研究人员提出了一种方法，将多token预测（MTP）改造到已部署的Gemini Nano v3模型上，无需重新训练主干网络，从而在移动设备上实现更快的推理速度和更低的能耗。该方法在Pixel 9和10系列上已部署，使AI通知摘要和校对等功能速度提升50%以上。

通过冻结的主干网络和轻量级MTP头部，实现了对现有模型的无缝加速，避免了单独草稿模型的内存开销。
零拷贝架构让MTP头部直接利用主模型的KV缓存，减少了130MB内存占用，并消除了草稿预填充延迟。

优化云经济：线性弹性缓存技术

2026-06-25 18:03 UTC+8

谷歌研究人员提出线性弹性缓存，将缓存管理建模为滑雪租赁问题，通过轻量级机器学习动态调整缓存大小，在Spanner生产环境中降低了15.5%内存使用和约5%总拥有成本，同时缓存未命中仅增加5.5%，且对I/O成本影响极小。

线性弹性缓存将内存成本视为连续变量，动态调整缓存大小，而非固定分配。
基于滑雪租赁问题，为每个数据项决定“租用”内存或“购买”未命中代价。

思考即回忆：推理如何解锁大语言模型中的参数化知识

2026-06-25 00:51 UTC+8

Google Research 的研究揭示了一个反直觉的现象：即使对于简单的事实性问题，让大语言模型生成推理链也能提高答案的准确性。研究发现两种机制：计算缓冲（生成额外标记用于潜在计算）和事实启动（生成相关事实以帮助召回正确答案）。

推理帮助模型召回原本无法获取的简单事实，即使无需逐步推理。
机制一：计算缓冲——生成无意义的推理标记也提供额外计算，提升召回。

AI如何帮助用户理解皮肤状况的研究

2026-06-13 01:52 UTC+8

谷歌研究团队发布了两项关于皮肤病AI工具的研究。大型调查显示，AI辅助使用户命名皮肤状况的准确率提高了近三倍，但在决定下一步行动方面仍有挑战。社区定性研究表明，该应用有助于用户和临床医生沟通，92%的临床医生认为其有帮助。

AI辅助使命名准确率从8%提高到23%，提升近三倍。
在决定下一步医疗行动（如家庭疗法还是就医）方面，AI未带来显著改善。

机器学习遗忘审计新框架

2026-06-11 01:34 UTC+8

Google研究人员提出正则化f-散度核检验框架，用于审计机器学习模型的遗忘和隐私保护。该框架自适应选择最优散度度量，能够更敏感地检测数据泄露和遗忘失败，且所需样本更少，调参更少。

传统双样本检验在大规模模型中失效，新框架更灵敏且自适应。
利用f-散度（卡方、KL、曲棍球棒）检测全局和局部数据偏移。

借助 Gemini Enterprise Agent Platform 的智能体 RAG 解锁可靠回答

2026-06-05 19:26 UTC+8

Google Research 与 Google Cloud 合作推出智能体 RAG 框架，通过多智能体工作流将复杂企业查询分解，迭代搜索足够上下文后生成可靠回答。相比标准 RAG，准确性提升高达 34%。

多智能体 RAG 通过规划、重写和路由分解复杂查询
Sufficient Context Agent 确保持续搜索直到上下文完整

谷歌研究人员开发了一种名为PHRM的系统，可在日常使用智能手机时，通过前置摄像头被动测量心率和静息心率。这项发表于《自然》杂志的研究显示，该系统的心率测量平均绝对百分比误差（MAPE）低于10%（与心电图相比），每日静息心率测量平均绝对误差（MAE）低于5次/分钟（与可穿戴设备相比）。系统在来自近700名参与者的超过35万段视频片段上进行了训练，确保肤色均衡代表性。PHRM优于15种领先的远程光电容积描记法（rPPG）模型，是唯一在真实世界条件下对所有肤色均达到准确性标准的模型。

谷歌的PHRM系统利用智能手机前置摄像头，在面部解锁后被动监测心率和静息心率。
在《自然》研究中，PHRM的心率MAPE<10%（vs. ECG），每日静息心率MAE<5 bpm（vs. 可穿戴设备），适用于所有肤色。

创新新时代：Google Research在I/O 2026的展示

2026-05-29 04:58 UTC+8

在2026年Google I/O大会上，Google Research展示了一系列前沿技术，涵盖科学发现、健康、边缘计算和天气预测等领域。推出了Gemini for Science套件（包括ERA和Co-Scientist），加速科学研究；健康方面有Google Health应用、Symptom AI和AMIE系统；Coral NPU推动边缘AI发展；还有极端天气预测模型。这些创新展示了AI如何放大人类的智慧。

Google发布Gemini for Science，内含ERA和Co-Scientist，加速科学发现。
健康领域推出Google Health应用、Symptom AI和AMIE，提升医疗服务质量。

实证研究助手（ERA）：从《自然》论文到推动计算发现

2026-05-20 01:52 UTC+8

谷歌开发的实证研究助手（ERA）利用Gemini编写和优化科学代码，今日在《自然》杂志上发表，并通过Google Labs的受信任测试计划推出了计算发现原型。ERA在基因组学、流行病学等多个基准测试中达到专家级表现，并在预测、二氧化碳监测等领域带来实际应用。

ERA是一种AI工具，利用Gemini为科学家编写和优化代码，解决实验中反复测试的难题。
在《自然》杂志发表的论文中，ERA在多个科学领域的基准测试中达到专家级性能。

通过全球合作与开放资源催化科学影响力

2026-05-02 00:37 UTC+8

Google Research 秉持开放科学原则，通过开源软件和开放数据集，与全球科研社区合作，推动基因组学、神经科学、气候、生物多样性、医疗等领域的突破性发现。文章详细介绍了多个工具（如DeepVariant、Neuroglancer、Open Buildings、SpeciesNet、HAI-DEF）及其实际应用案例，展示了开放科学如何赋能全球研究人员并产生积极社会影响。

Google Research 通过与全球多家机构合作，释放开放科学的力量。
开源工具和数据集已赋能超过25万研究人员，涵盖基因组学、神经科学、气候、生物多样性和医疗健康。

谷歌研究科学家使用实证研究辅助的四种方式

2026-04-30 05:07 UTC+8

自2025年秋季引入实证研究辅助（ERA）以来，谷歌研究科学家已将其应用于流行病学、宇宙学、大气监测和神经科学等领域的实际场景，展示了AI加速科学发现的变革能力。

ERA在流感、COVID-19和RSV住院预测中达到或超过CDC工具的准确性。
ERA结合Gemini Deep Think解决了宇宙弦引力辐射的未解问题。

关键在于角度：重新构图你的照片

2026-04-23 01:00 UTC+8

Google Photos 的 Auto frame 功能利用机器学习模型将照片视为 3D 场景，自动调整相机视角，生成全新的照片。该方法分为 3D 场景估计和生成式修补两个阶段，能够修复透视畸变，改善肖像照片。

Google Photos 推出 Auto frame 功能，利用 AI 自动重新构图照片。
该技术将 2D 照片解释为 3D 场景，调整相机角度以生成新视角。

ReasoningBank：让智能体从经验中学习

2026-04-22 00:42 UTC+8

Google Cloud的研究人员提出了ReasoningBank，一种新型智能体记忆框架，能从成功和失败经验中提炼可推广的推理策略，显著提升智能体在复杂任务中的表现和效率。

ReasoningBank从成功和失败经验中提取结构化记忆，包含标题、描述和内容。
通过记忆感知测试时扩展（MaTTS），进一步利用并行和顺序扩展提升性能。

为现实世界设计合成数据集：从第一性原理出发的机制设计与推理

2026-04-16 22:41 UTC+8

谷歌推出Simula框架，将合成数据生成重新定义为数据集层面的机制设计。通过从第一性原理出发的推理式方法，Simula实现了对数据覆盖度、复杂度和质量的精细控制，适用于隐私敏感或数据稀缺的专门领域。

Simula将合成数据生成视为数据集层面的机制设计问题。
框架将生成过程分解为四个可控轴：全局多样化、局部多样化、复杂化和质量检查。

AI生成的合成神经元加速大脑图谱绘制

2026-04-16 20:18 UTC+8

谷歌研究团队开发了MoGen模型，利用AI生成合成神经元形态，用于训练脑图谱重建模型，使重建错误率降低4.4%。在完整小鼠大脑尺度上，这相当于节省157人年的人工校对工作。该成果为加速大规模脑连接组学项目提供了新工具。

MoGen模型通过点云流匹配生成逼真的3D神经元形状，用于增强训练数据。
将10%的合成数据加入PATHFINDER模型训练，减少了4.4%的重建错误，主要降低了合并错误率。

利用生成式AI培养面向未来的技能

2026-04-14 02:15 UTC+8

谷歌研究与纽约大学合作开发了Vantage，这是一个利用生成式AI评估团队合作和批判性思维等面向未来技能的系统。该系统通过AI化身模拟对话，由执行LLM动态引导，评估结果与人类专家高度一致。目前Vantage已在Google Labs开放注册。

Vantage使用生成式AI创建模拟环境，评估学生面向未来的技能。
执行LLM驱动AI化身，在对话中引入特定挑战以收集技能证据。

ConvApparel：衡量并弥合用户模拟器中的真实感差距

2026-04-09 19:22 UTC+8

谷歌研究院发布ConvApparel数据集和评估框架，用于量化LLM用户模拟器的真实感差距，并训练更鲁棒的对话代理。通过双代理数据收集和三支柱验证，研究发现数据驱动模拟器优于提示基础，但真实感差距依然存在。

ConvApparel包含4000多人机对话，通过“好”与“坏”两种代理采集数据。
评估框架包括人口统计对齐、人类相似度评分和反事实验证三支柱。

改善学术工作流程：引入两个AI代理以改进图表制作和同行评审

2026-04-09 04:01 UTC+8

Google Cloud 的研究团队推出了两个创新的 AI 代理：PaperVizAgent 用于自动生成高质量的学术图表，ScholarPeer 用于自动进行严格的学术论文评审。这两个系统通过多代理协作和迭代优化，在各自任务上显著超越了现有基线，为科学研究流程带来了实质性改进。

PaperVizAgent 是一个多代理框架，能够从学术文本自动生成出版就绪的图表，包括方法论示意图和统计图。
ScholarPeer 模拟高级研究员的评审流程，通过上下文获取和主动验证生成深入、基于文献的评审意见。

评估大语言模型行为倾向的对齐性

2026-04-03 16:00 UTC+8

谷歌研究团队提出了一种系统评估框架，将心理学问卷转化为情境判断测试，量化LLM行为倾向与人类共识的对齐程度。对25个模型的测试发现，模型在高共识场景下存在偏差，且在低共识场景中过度自信，未能反映人类观点的多样性。

新框架将心理学问卷转化为情境判断测试，评估LLM在现实场景中的行为倾向。
25个模型在人类高共识场景中表现良好，但在共识较低时过度自信且方向不一。

Google Research Blog