11个演示:Gemini Omni和Gemini 3.5的实际应用
在Google I/O 2026上,Google发布了Gemini Omni和Gemini 3.5系列模型。Gemini Omni能够从任何输入(如视频)生成内容,并通过自然语言编辑视频。Gemini 3.5 Flash则专注于复杂代理任务,支持多步骤工作流和代码生成。本文通过11个视频演示了这些模型的能力,包括视频编辑、代理任务、UI生成等。
文章情报
要点
- Gemini Omni可基于视频输入生成新内容,并通过对话编辑视频。
- Gemini 3.5 Flash适合执行长期代理任务,支持多步骤工作流。
- 3.5 Flash与Antigravity结合,可部署协作子代理处理大规模问题。
- 信息代理和生成式UI功能将于今夏在搜索中推出。
为什么重要
这条新闻值得关注,因为Gemini Omni可基于视频输入生成新内容,并通过对话编辑视频。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
在Google I/O 2026大会上,Google发布了其最新模型:Gemini Omni和Gemini 3.5系列。Gemini Omni是一款能够从任何输入(包括视频)创建内容的模型。它结合了图像、音频、视频和文本作为输入,并基于Gemini的现实世界知识生成高质量视频。用户还可以通过对话轻松编辑视频。
Gemini 3.5系列是前沿智能与行动能力的结合,代表了构建更强大、更智能代理的重大飞跃。该系列的首个模型是3.5 Flash,它在代理和编码方面表现出色,擅长处理复杂的长期任务,提供实际效用。
为了帮助用户更清晰地了解这些模型,Google展示了11个演示视频。
Gemini Omni
通过对话编辑视频:Omni的独特能力之一是允许用户使用自然语言编辑视频。每一次指令都基于上一次,角色保持一致,物理规律得以维持,场景记住之前的内容。用户可以改变特定元素或整个场景,将现有视频转变为原本无法拍摄的内容。
重新构想动作:用户可以对已拍摄的视频提出要求,改变其中的动作、添加新角色或物体,或将某个时刻转变为意想不到的场景。
多轮优化视频:用户可以改变环境、角度、风格甚至细节,而不会丢失原始场景的线索。演示展示了如何通过连续编辑将小提琴手从原始场景转移到图像环境中,并使小提琴隐形,改变摄像机角度等。
Gemini 3.5 Flash
大规模处理代理任务:3.5 Flash在多个维度上提供了与大型旗舰模型相媲美的智能,同时保持了Flash系列的速度。这种速度与性能的平衡使其非常适合处理长期代理任务。在Antigravity的支持下,3.5 Flash能够自动执行多步骤工作流,根据动态标准重命名和分类非结构化资源。
与更新后的Antigravity框架结合时,3.5 Flash成为部署协作子代理的强大引擎,能够大规模处理最苛刻的用例。在监督下,它可以可靠地执行多步骤工作流和编码任务,同时保持前沿性能。
创建更丰富、更具交互性的Web UI和图形:3.5 Flash在Gemini 3的强大多模态基础上构建,在Antigravity支持下,使用子代理创建了数学概念π的美丽可视化。
用户可以并行开发多个创意概念:在示例中,3.5 Flash在Antigravity中以高速创建了64种分形变体。
通过迭代循环更快编码:在AI Studio上,3.5 Flash在60秒内生成了结账流程的不同UX方法。
个人AI代理和新智能体验
3.5 Flash现已成为Gemini应用和搜索中AI模式的默认模型,其代理能力为日常生活带来前沿智能。增强的代理编码能力为搜索带来了更智能的体验,例如新的信息代理。这些代理7x24小时在后台运行,智能推理信息,在正确时刻找到用户所需内容,并发送包含链接的综合更新。信息代理将于今年夏天首先面向Google AI Pro和Ultra订阅用户推出。
借助Google Antigravity和Gemini 3.5 Flash的代理编码能力,搜索可以即时构建理想的响应格式。用户可以获得定制的生成式UI,包括可视化工具和模拟,这些功能将于今年夏天免费向所有搜索用户提供。
对于婚礼策划或健身计划等持续性任务,搜索将构建自定义体验,如仪表盘、跟踪器或迷你应用。未来几个月,美国Google AI Pro和Ultra订阅用户将能够在搜索中创建自定义体验。
此外,新的Gemini Spark个人AI代理基于Gemini 3.5和Antigravity框架,7x24小时运行,帮助用户管理数字生活并与Workspace工具深度集成。Gemini Spark正在向可信测试者推出,并计划作为Beta版面向美国Google AI Ultra订阅用户发布。
Gemini Omni Flash现面向全球Google AI Plus、Pro和Ultra订阅用户通过Gemini应用和Google Flow推出,同时也免费向YouTube Shorts和YouTube Create App用户提供。未来几周,还将通过API向开发者和企业客户推出。
Gemini 3.5 Flash现通过Google Antigravity、Gemini API(在Google AI Studio和Android Studio中)、Gemini Enterprise Agent Platform和Gemini Enterprise普遍可用,同时在搜索的AI模式中面向所有用户,并正在向全球Gemini应用用户推出。