11個演示:Gemini Omni和Gemini 3.5的實際應用
在Google I/O 2026上,Google釋出了Gemini Omni和Gemini 3.5系列模型。Gemini Omni能夠從任何輸入(如影片)生成內容,並透過自然語言編輯影片。Gemini 3.5 Flash則專注於複雜代理任務,支援多步驟工作流和程式碼生成。本文透過11個影片演示了這些模型的能力,包括影片編輯、代理任務、UI生成等。
文章情報
要點
- Gemini Omni可基於影片輸入生成新內容,並透過對話編輯影片。
- Gemini 3.5 Flash適合執行長期代理任務,支援多步驟工作流。
- 3.5 Flash與Antigravity結合,可部署協作子代理處理大規模問題。
- 資訊代理和生成式UI功能將於今夏在搜尋中推出。
為什麼重要
這條新聞值得關注,因為Gemini Omni可基於影片輸入生成新內容,並透過對話編輯影片。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
在Google I/O 2026大會上,Google釋出了其最新模型:Gemini Omni和Gemini 3.5系列。Gemini Omni是一款能夠從任何輸入(包括影片)建立內容的模型。它結合了影像、音訊、影片和文本作為輸入,並基於Gemini的現實世界知識生成高質量影片。使用者還可以透過對話輕鬆編輯影片。
Gemini 3.5系列是前沿智慧與行動能力的結合,代表了構建更強大、更智慧代理的重大飛躍。該系列的首個模型是3.5 Flash,它在代理和編碼方面表現出色,擅長處理複雜的長期任務,提供實際效用。
為了幫助使用者更清晰地瞭解這些模型,Google展示了11個演示影片。
Gemini Omni
透過對話編輯影片:Omni的獨特能力之一是允許使用者使用自然語言編輯影片。每一次指令都基於上一次,角色保持一致,物理規律得以維持,場景記住之前的內容。使用者可以改變特定元素或整個場景,將現有影片轉變為原本無法拍攝的內容。
重新構想動作:使用者可以對已拍攝的影片提出要求,改變其中的動作、新增新角色或物體,或將某個時刻轉變為意想不到的場景。
多輪最佳化影片:使用者可以改變環境、角度、風格甚至細節,而不會丟失原始場景的線索。演示展示瞭如何透過連續編輯將小提琴手從原始場景轉移到影像環境中,並使小提琴隱形,改變攝像機角度等。
Gemini 3.5 Flash
大規模處理代理任務:3.5 Flash在多個維度上提供了與大型旗艦模型相媲美的智慧,同時保持了Flash系列的速度。這種速度與效能的平衡使其非常適合處理長期代理任務。在Antigravity的支援下,3.5 Flash能夠自動執行多步驟工作流,根據動態標準重新命名和分類非結構化資源。
與更新後的Antigravity框架結合時,3.5 Flash成為部署協作子代理的強大引擎,能夠大規模處理最苛刻的用例。在監督下,它可以可靠地執行多步驟工作流和編碼任務,同時保持前沿效能。
建立更豐富、更具互動性的Web UI和圖形:3.5 Flash在Gemini 3的強大多模態基礎上構建,在Antigravity支援下,使用子代理建立了數學概念π的美麗視覺化。
使用者可以並行開發多個創意概念:在示例中,3.5 Flash在Antigravity中以高速建立了64種分形變體。
透過迭代迴圈更快編碼:在AI Studio上,3.5 Flash在60秒內生成了結賬流程的不同UX方法。
個人AI代理和新智慧體驗
3.5 Flash現已成為Gemini應用和搜尋中AI模式的預設模型,其代理能力為日常生活帶來前沿智慧。增強的代理編碼能力為搜尋帶來了更智慧的體驗,例如新的資訊代理。這些代理7x24小時在後臺執行,智慧推理資訊,在正確時刻找到使用者所需內容,併傳送包含連結的綜合更新。資訊代理將於今年夏天首先面向Google AI Pro和Ultra訂閱使用者推出。
藉助Google Antigravity和Gemini 3.5 Flash的代理編碼能力,搜尋可以即時構建理想的響應格式。使用者可以獲得定製的生成式UI,包括視覺化工具和模擬,這些功能將於今年夏天免費向所有搜尋使用者提供。
對於婚禮策劃或健身計劃等持續性任務,搜尋將構建自定義體驗,如儀表盤、跟蹤器或迷你應用。未來幾個月,美國Google AI Pro和Ultra訂閱使用者將能夠在搜尋中建立自定義體驗。
此外,新的Gemini Spark個人AI代理基於Gemini 3.5和Antigravity框架,7x24小時執行,幫助使用者管理數字生活並與Workspace工具深度整合。Gemini Spark正在向可信測試者推出,並計劃作為Beta版面向美國Google AI Ultra訂閱使用者釋出。
Gemini Omni Flash現面向全球Google AI Plus、Pro和Ultra訂閱使用者透過Gemini應用和Google Flow推出,同時也免費向YouTube Shorts和YouTube Create App使用者提供。未來幾周,還將透過API向開發者和企業客戶推出。
Gemini 3.5 Flash現透過Google Antigravity、Gemini API(在Google AI Studio和Android Studio中)、Gemini Enterprise Agent Platform和Gemini Enterprise普遍可用,同時在搜尋的AI模式中面向所有使用者,並正在向全球Gemini應用使用者推出。