谷歌推出Gemini 3.5 Flash和Spark,將AI從聊天機器人推向自主執行
谷歌發佈Gemini 3.5 Flash,一款高速執行引擎,旨在處理多步驟複雜任務並實現自主決策。該模型在編碼和智能體基準測試中表現優異,速度是其他前沿模型的4倍。同時,谷歌推出全天候個人AI助手Gemini Spark,並拓展AI世界模型Omni。
人工智能不僅變得更智能、更快速,還變得更加自主。谷歌通過新的Gemini 3.5 Flash引入了一個用於現實世界任務的高速執行引擎。它作為一個主動的問題解決者,能夠快速思考並高效行動。
據谷歌稱,Gemini 3.5 Flash可以處理涉及多個步驟的複雜任務,同時保持快速響應。目標是構建能夠同時規劃任務並完成任務的AI系統,減少用户指導。該模型通過Gemini應用和Google搜索的AI模式向公眾開放。開發者可以通過谷歌的智能體優先開發平台Google Antigravity以及Google AI Studio和Android Studio中的Gemini API訪問它。企業用户則可通過Gemini Enterprise Agent Platform和Gemini Enterprise使用。
更重量級的Gemini 3.5 Pro版本目前內部使用,預計下個月才會廣泛發佈。谷歌表示,Gemini 3.5 Flash是其迄今為止最強的智能體和編碼模型,在Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和MCP Atlas(83.6%)等基準測試中表現出色,並在多模態理解方面領先(CharXiv Reasoning達到84.2%)。該模型的輸出速度是其他前沿模型的4倍。
基準測試結果表明,Gemini 3.5 Flash對於運行實時AI代理、編碼工具、搜索系統和工作流自動化的企業特別有用,其中速度和決策能力至關重要。這也表明,現在更多模型是根據其使用工具、穿越工作流和自主完成任務的能力來評判的。
谷歌還推出了Gemini Spark,一款全天候個人AI代理,將Gemini 3.5 Flash作為其默認模型。該公司表示,Spark旨在跨連接的應用和服務採取行動,同時保持在用户控制之下。Spark在某些方面是谷歌對OpenClaw的回應,但更相似之處在於兩者都反映了行業向行動型AI系統而非僅聊天型轉變的方向。
此外,谷歌通過Omni擴展AI世界模型,這是一款新的AI視頻模型,旨在模擬物理環境並根據用户行動預測結果。Omni將支持圖像、音頻和視頻功能,應用於Google Flow和YouTube Shorts等產品。
Gemini 3.5 Flash的推出凸顯了AI行業競爭正日益轉向自主執行,而非傳統的聊天機器人交互。OpenAI、Anthropic、微軟和xAI都在競相構建能夠推理並執行復雜任務的系統。通過Gemini 3.5 Flash,谷歌似乎將Gemini定位為面向消費者和企業環境的更具操作性的AI系統,這可能有助於其與其他公司區分開來。