2026-05-21 04:25 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

谷歌推出Gemini 3.5 Flash和Spark，將AI從聊天機器人推向自主執行

谷歌發佈Gemini 3.5 Flash，一款高速執行引擎，旨在處理多步驟複雜任務並實現自主決策。該模型在編碼和智能體基準測試中表現優異，速度是其他前沿模型的4倍。同時，谷歌推出全天候個人AI助手Gemini Spark，並拓展AI世界模型Omni。

來源AIwire作者: Ali Azhar

人工智能不僅變得更智能、更快速，還變得更加自主。谷歌通過新的Gemini 3.5 Flash引入了一個用於現實世界任務的高速執行引擎。它作為一個主動的問題解決者，能夠快速思考並高效行動。

據谷歌稱，Gemini 3.5 Flash可以處理涉及多個步驟的複雜任務，同時保持快速響應。目標是構建能夠同時規劃任務並完成任務的AI系統，減少用户指導。該模型通過Gemini應用和Google搜索的AI模式向公眾開放。開發者可以通過谷歌的智能體優先開發平台Google Antigravity以及Google AI Studio和Android Studio中的Gemini API訪問它。企業用户則可通過Gemini Enterprise Agent Platform和Gemini Enterprise使用。

更重量級的Gemini 3.5 Pro版本目前內部使用，預計下個月才會廣泛發佈。谷歌表示，Gemini 3.5 Flash是其迄今為止最強的智能體和編碼模型，在Terminal-Bench 2.1（76.2%）、GDPval-AA（1656 Elo）和MCP Atlas（83.6%）等基準測試中表現出色，並在多模態理解方面領先（CharXiv Reasoning達到84.2%）。該模型的輸出速度是其他前沿模型的4倍。

基準測試結果表明，Gemini 3.5 Flash對於運行實時AI代理、編碼工具、搜索系統和工作流自動化的企業特別有用，其中速度和決策能力至關重要。這也表明，現在更多模型是根據其使用工具、穿越工作流和自主完成任務的能力來評判的。

谷歌還推出了Gemini Spark，一款全天候個人AI代理，將Gemini 3.5 Flash作為其默認模型。該公司表示，Spark旨在跨連接的應用和服務採取行動，同時保持在用户控制之下。Spark在某些方面是谷歌對OpenClaw的回應，但更相似之處在於兩者都反映了行業向行動型AI系統而非僅聊天型轉變的方向。

此外，谷歌通過Omni擴展AI世界模型，這是一款新的AI視頻模型，旨在模擬物理環境並根據用户行動預測結果。Omni將支持圖像、音頻和視頻功能，應用於Google Flow和YouTube Shorts等產品。

Gemini 3.5 Flash的推出凸顯了AI行業競爭正日益轉向自主執行，而非傳統的聊天機器人交互。OpenAI、Anthropic、微軟和xAI都在競相構建能夠推理並執行復雜任務的系統。通過Gemini 3.5 Flash，谷歌似乎將Gemini定位為面向消費者和企業環境的更具操作性的AI系統，這可能有助於其與其他公司區分開來。