AI News HubLIVE
站内改写2 分钟阅读

谷歌推出Gemini 3.5 Flash和Spark,将AI从聊天机器人推向自主执行

谷歌发布Gemini 3.5 Flash,一款高速执行引擎,旨在处理多步骤复杂任务并实现自主决策。该模型在编码和智能体基准测试中表现优异,速度是其他前沿模型的4倍。同时,谷歌推出全天候个人AI助手Gemini Spark,并拓展AI世界模型Omni。

来源AIwire作者: Ali Azhar

人工智能不仅变得更智能、更快速,还变得更加自主。谷歌通过新的Gemini 3.5 Flash引入了一个用于现实世界任务的高速执行引擎。它作为一个主动的问题解决者,能够快速思考并高效行动。

据谷歌称,Gemini 3.5 Flash可以处理涉及多个步骤的复杂任务,同时保持快速响应。目标是构建能够同时规划任务并完成任务的AI系统,减少用户指导。该模型通过Gemini应用和Google搜索的AI模式向公众开放。开发者可以通过谷歌的智能体优先开发平台Google Antigravity以及Google AI Studio和Android Studio中的Gemini API访问它。企业用户则可通过Gemini Enterprise Agent Platform和Gemini Enterprise使用。

更重量级的Gemini 3.5 Pro版本目前内部使用,预计下个月才会广泛发布。谷歌表示,Gemini 3.5 Flash是其迄今为止最强的智能体和编码模型,在Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和MCP Atlas(83.6%)等基准测试中表现出色,并在多模态理解方面领先(CharXiv Reasoning达到84.2%)。该模型的输出速度是其他前沿模型的4倍。

基准测试结果表明,Gemini 3.5 Flash对于运行实时AI代理、编码工具、搜索系统和工作流自动化的企业特别有用,其中速度和决策能力至关重要。这也表明,现在更多模型是根据其使用工具、穿越工作流和自主完成任务的能力来评判的。

谷歌还推出了Gemini Spark,一款全天候个人AI代理,将Gemini 3.5 Flash作为其默认模型。该公司表示,Spark旨在跨连接的应用和服务采取行动,同时保持在用户控制之下。Spark在某些方面是谷歌对OpenClaw的回应,但更相似之处在于两者都反映了行业向行动型AI系统而非仅聊天型转变的方向。

此外,谷歌通过Omni扩展AI世界模型,这是一款新的AI视频模型,旨在模拟物理环境并根据用户行动预测结果。Omni将支持图像、音频和视频功能,应用于Google Flow和YouTube Shorts等产品。

Gemini 3.5 Flash的推出凸显了AI行业竞争正日益转向自主执行,而非传统的聊天机器人交互。OpenAI、Anthropic、微软和xAI都在竞相构建能够推理并执行复杂任务的系统。通过Gemini 3.5 Flash,谷歌似乎将Gemini定位为面向消费者和企业环境的更具操作性的AI系统,这可能有助于其与其他公司区分开来。