2026-05-20 01:45 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

I/O 2026：欢迎进入智能体Gemini时代

在Google I/O 2026上，CEO Sundar Pichai宣布了多项AI进展，包括全新模型Gemini Omni、更快的Gemini 3.5 Flash、Ask YouTube、Docs Live等功能，以及TPU第八代芯片和SynthID水印的行业合作。

来源Google AI Blog

Google I/O 2026大会于今日举行，CEO Sundar Pichai发表了主题演讲，介绍了公司在AI领域的最新突破。Pichai强调，过去一年是“不断发布、技术进步和超高速发展”的时期，AI正在融入用户日常使用的产品中。

Gemini模型是本次大会的核心。Pichai宣布了Gemini Omni，这是一个能够从任何输入（文本、图像、视频等）生成任何输出格式（目前以视频为主，未来将包括图像和文本）的模型。这是Gemini智能与生成式媒体模型的融合，被认为是世界理解的一大飞跃。首款Omni系列模型Gemini Omni Flash即日起在Gemini应用、Google Flow和YouTube Shorts中可用，并将在未来几周内向开发者和企业开放API。

另一重要发布是Gemini 3.5 Flash，该模型在几乎所有基准测试上都优于之前的3.1 Pro，特别是在编码和GDPVal（衡量经济价值任务的指标）上取得了巨大进步。它的输出速度比其他前沿模型快4倍，同时成本不到后者的一半。Pichai举例称，如果企业将80%的工作负载从其他前沿模型转移到3.5 Flash，每年可节省超过10亿美元。

在产品方面，YouTube推出了“Ask YouTube”功能，用户可以用自然语言提问，系统会直接跳转到相关视频的相关段落。Docs Live则允许用户通过语音“脑暴”，由Gemini自动生成文档，未来还将支持语音编辑。这些功能将陆续在夏季向订阅用户推出。

基础设施方面，Google宣布了第八代TPU芯片：TPU 8t用于训练，性能是前代的3倍；TPU 8i用于推理，大幅降低延迟。两者能效提升2倍。训练现已可跨100多万个TPU分布式进行，使大规模模型训练从数月缩短至数周。

在AI透明度方面，SynthID水印已标记超过1000亿张图片和视频，以及6万年的音频资产。Google将把内容凭证和SynthID验证扩展到搜索和Chrome。OpenAI、Kakao和Eleven Labs也加入了SynthID合作，共同推动行业标准。

Pichai总结道，AI的采用正在以指数级增长：每月处理超过3.2千万亿个token，模型API每分钟处理190亿个token，超过850万开发者每月使用Gemini模型。Google将继续以全栈方式推进AI创新，从定制芯片到平台产品，覆盖数十亿用户。