AI News HubLIVE
站内改写2 分钟阅读

I/O 2026:欢迎进入智能体Gemini时代

在Google I/O 2026上,CEO Sundar Pichai宣布了多项AI进展,包括全新模型Gemini Omni、更快的Gemini 3.5 Flash、Ask YouTube、Docs Live等功能,以及TPU第八代芯片和SynthID水印的行业合作。

Google I/O 2026大会于今日举行,CEO Sundar Pichai发表了主题演讲,介绍了公司在AI领域的最新突破。Pichai强调,过去一年是“不断发布、技术进步和超高速发展”的时期,AI正在融入用户日常使用的产品中。

Gemini模型是本次大会的核心。Pichai宣布了Gemini Omni,这是一个能够从任何输入(文本、图像、视频等)生成任何输出格式(目前以视频为主,未来将包括图像和文本)的模型。这是Gemini智能与生成式媒体模型的融合,被认为是世界理解的一大飞跃。首款Omni系列模型Gemini Omni Flash即日起在Gemini应用、Google Flow和YouTube Shorts中可用,并将在未来几周内向开发者和企业开放API。

另一重要发布是Gemini 3.5 Flash,该模型在几乎所有基准测试上都优于之前的3.1 Pro,特别是在编码和GDPVal(衡量经济价值任务的指标)上取得了巨大进步。它的输出速度比其他前沿模型快4倍,同时成本不到后者的一半。Pichai举例称,如果企业将80%的工作负载从其他前沿模型转移到3.5 Flash,每年可节省超过10亿美元。

在产品方面,YouTube推出了“Ask YouTube”功能,用户可以用自然语言提问,系统会直接跳转到相关视频的相关段落。Docs Live则允许用户通过语音“脑暴”,由Gemini自动生成文档,未来还将支持语音编辑。这些功能将陆续在夏季向订阅用户推出。

基础设施方面,Google宣布了第八代TPU芯片:TPU 8t用于训练,性能是前代的3倍;TPU 8i用于推理,大幅降低延迟。两者能效提升2倍。训练现已可跨100多万个TPU分布式进行,使大规模模型训练从数月缩短至数周。

在AI透明度方面,SynthID水印已标记超过1000亿张图片和视频,以及6万年的音频资产。Google将把内容凭证和SynthID验证扩展到搜索和Chrome。OpenAI、Kakao和Eleven Labs也加入了SynthID合作,共同推动行业标准。

Pichai总结道,AI的采用正在以指数级增长:每月处理超过3.2千万亿个token,模型API每分钟处理190亿个token,超过850万开发者每月使用Gemini模型。Google将继续以全栈方式推进AI创新,从定制芯片到平台产品,覆盖数十亿用户。