2026-05-21 04:25 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

谷歌推出Gemini 3.5 Flash和Spark，将AI从聊天机器人推向自主执行

谷歌发布Gemini 3.5 Flash，一款高速执行引擎，旨在处理多步骤复杂任务并实现自主决策。该模型在编码和智能体基准测试中表现优异，速度是其他前沿模型的4倍。同时，谷歌推出全天候个人AI助手Gemini Spark，并拓展AI世界模型Omni。

来源AIwire作者: Ali Azhar

人工智能不仅变得更智能、更快速，还变得更加自主。谷歌通过新的Gemini 3.5 Flash引入了一个用于现实世界任务的高速执行引擎。它作为一个主动的问题解决者，能够快速思考并高效行动。

据谷歌称，Gemini 3.5 Flash可以处理涉及多个步骤的复杂任务，同时保持快速响应。目标是构建能够同时规划任务并完成任务的AI系统，减少用户指导。该模型通过Gemini应用和Google搜索的AI模式向公众开放。开发者可以通过谷歌的智能体优先开发平台Google Antigravity以及Google AI Studio和Android Studio中的Gemini API访问它。企业用户则可通过Gemini Enterprise Agent Platform和Gemini Enterprise使用。

更重量级的Gemini 3.5 Pro版本目前内部使用，预计下个月才会广泛发布。谷歌表示，Gemini 3.5 Flash是其迄今为止最强的智能体和编码模型，在Terminal-Bench 2.1（76.2%）、GDPval-AA（1656 Elo）和MCP Atlas（83.6%）等基准测试中表现出色，并在多模态理解方面领先（CharXiv Reasoning达到84.2%）。该模型的输出速度是其他前沿模型的4倍。

基准测试结果表明，Gemini 3.5 Flash对于运行实时AI代理、编码工具、搜索系统和工作流自动化的企业特别有用，其中速度和决策能力至关重要。这也表明，现在更多模型是根据其使用工具、穿越工作流和自主完成任务的能力来评判的。

谷歌还推出了Gemini Spark，一款全天候个人AI代理，将Gemini 3.5 Flash作为其默认模型。该公司表示，Spark旨在跨连接的应用和服务采取行动，同时保持在用户控制之下。Spark在某些方面是谷歌对OpenClaw的回应，但更相似之处在于两者都反映了行业向行动型AI系统而非仅聊天型转变的方向。

此外，谷歌通过Omni扩展AI世界模型，这是一款新的AI视频模型，旨在模拟物理环境并根据用户行动预测结果。Omni将支持图像、音频和视频功能，应用于Google Flow和YouTube Shorts等产品。

Gemini 3.5 Flash的推出凸显了AI行业竞争正日益转向自主执行，而非传统的聊天机器人交互。OpenAI、Anthropic、微软和xAI都在竞相构建能够推理并执行复杂任务的系统。通过Gemini 3.5 Flash，谷歌似乎将Gemini定位为面向消费者和企业环境的更具操作性的AI系统，这可能有助于其与其他公司区分开来。