AI News HubLIVE
站内改写

11個演示:Gemini Omni和Gemini 3.5的實際應用

在Google I/O 2026上,Google發佈了Gemini Omni和Gemini 3.5系列模型。Gemini Omni能夠從任何輸入(如視頻)生成內容,並通過自然語言編輯視頻。Gemini 3.5 Flash則專注於複雜代理任務,支持多步驟工作流和代碼生成。本文通過11個視頻演示了這些模型的能力,包括視頻編輯、代理任務、UI生成等。

文章情報

工程師進階

要點

  • Gemini Omni可基於視頻輸入生成新內容,並通過對話編輯視頻。
  • Gemini 3.5 Flash適合執行長期代理任務,支持多步驟工作流。
  • 3.5 Flash與Antigravity結合,可部署協作子代理處理大規模問題。
  • 信息代理和生成式UI功能將於今夏在搜索中推出。

為甚麼重要

這條新聞值得關注,因為Gemini Omni可基於視頻輸入生成新內容,並通過對話編輯視頻。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

在Google I/O 2026大會上,Google發佈了其最新模型:Gemini Omni和Gemini 3.5系列。Gemini Omni是一款能夠從任何輸入(包括視頻)創建內容的模型。它結合了圖像、音頻、視頻和文本作為輸入,並基於Gemini的現實世界知識生成高質量視頻。用户還可以通過對話輕鬆編輯視頻。

Gemini 3.5系列是前沿智能與行動能力的結合,代表了構建更強大、更智能代理的重大飛躍。該系列的首個模型是3.5 Flash,它在代理和編碼方面表現出色,擅長處理複雜的長期任務,提供實際效用。

為了幫助用户更清晰地瞭解這些模型,Google展示了11個演示視頻。

Gemini Omni

通過對話編輯視頻:Omni的獨特能力之一是允許用户使用自然語言編輯視頻。每一次指令都基於上一次,角色保持一致,物理規律得以維持,場景記住之前的內容。用户可以改變特定元素或整個場景,將現有視頻轉變為原本無法拍攝的內容。

重新構想動作:用户可以對已拍攝的視頻提出要求,改變其中的動作、添加新角色或物體,或將某個時刻轉變為意想不到的場景。

多輪優化視頻:用户可以改變環境、角度、風格甚至細節,而不會丟失原始場景的線索。演示展示瞭如何通過連續編輯將小提琴手從原始場景轉移到圖像環境中,並使小提琴隱形,改變攝像機角度等。

Gemini 3.5 Flash

大規模處理代理任務:3.5 Flash在多個維度上提供了與大型旗艦模型相媲美的智能,同時保持了Flash系列的速度。這種速度與性能的平衡使其非常適合處理長期代理任務。在Antigravity的支持下,3.5 Flash能夠自動執行多步驟工作流,根據動態標準重命名和分類非結構化資源。

與更新後的Antigravity框架結合時,3.5 Flash成為部署協作子代理的強大引擎,能夠大規模處理最苛刻的用例。在監督下,它可以可靠地執行多步驟工作流和編碼任務,同時保持前沿性能。

創建更豐富、更具交互性的Web UI和圖形:3.5 Flash在Gemini 3的強大多模態基礎上構建,在Antigravity支持下,使用子代理創建了數學概念π的美麗可視化。

用户可以並行開發多個創意概念:在示例中,3.5 Flash在Antigravity中以高速創建了64種分形變體。

通過迭代循環更快編碼:在AI Studio上,3.5 Flash在60秒內生成了結賬流程的不同UX方法。

個人AI代理和新智能體驗

3.5 Flash現已成為Gemini應用和搜索中AI模式的默認模型,其代理能力為日常生活帶來前沿智能。增強的代理編碼能力為搜索帶來了更智能的體驗,例如新的信息代理。這些代理7x24小時在後台運行,智能推理信息,在正確時刻找到用户所需內容,併發送包含鏈接的綜合更新。信息代理將於今年夏天首先面向Google AI Pro和Ultra訂閲用户推出。

藉助Google Antigravity和Gemini 3.5 Flash的代理編碼能力,搜索可以即時構建理想的響應格式。用户可以獲得定製的生成式UI,包括可視化工具和模擬,這些功能將於今年夏天免費向所有搜索用户提供。

對於婚禮策劃或健身計劃等持續性任務,搜索將構建自定義體驗,如儀表盤、跟蹤器或迷你應用。未來幾個月,美國Google AI Pro和Ultra訂閲用户將能夠在搜索中創建自定義體驗。

此外,新的Gemini Spark個人AI代理基於Gemini 3.5和Antigravity框架,7x24小時運行,幫助用户管理數字生活並與Workspace工具深度集成。Gemini Spark正在向可信測試者推出,並計劃作為Beta版面向美國Google AI Ultra訂閲用户發佈。

Gemini Omni Flash現面向全球Google AI Plus、Pro和Ultra訂閲用户通過Gemini應用和Google Flow推出,同時也免費向YouTube Shorts和YouTube Create App用户提供。未來幾周,還將通過API向開發者和企業客户推出。

Gemini 3.5 Flash現通過Google Antigravity、Gemini API(在Google AI Studio和Android Studio中)、Gemini Enterprise Agent Platform和Gemini Enterprise普遍可用,同時在搜索的AI模式中面向所有用户,並正在向全球Gemini應用用户推出。