2026-06-07 19:00 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

序列雷达#873：上周AI：足球、S-1和超级模型

一场新的AI足球锦标赛、主要模型发布、融资活动以及Anthropic的S-1文件。

来源TheSequence作者: Jesus Rodriguez

本周，AI领域迎来了多项重大进展。首先，LayerLens宣布了Stratix杯，这是一场模拟足球锦标赛，16个前沿AI模型将参与其中，每个模型编写代码控制整支球队。比赛分为两个半场，模型可以根据上半场的表现调整策略。虽然这一比赛看似轻松有趣，但它凸显了AI评估需要更多样化的舞台。传统的静态考试式评估已不足以全面衡量模型在多智能体规划、战术适应、长期信用分配、对抗压力下的鲁棒性以及从错误中恢复的能力。足球比赛的复杂性和可观察性为AI行为提供了更真实的测试环境。

在Build大会上，微软推出了新一代MAI模型，涵盖推理、编码、图像、语音和转录等领域。其战略重点不仅是构建更多自有模型，更是将模型、开发者工具、智能体和设备紧密整合。GitHub Copilot、智能体安全原语、新模型发布以及AI原生工作流都表明，AI正从嵌入软件的聊天框转变为运行工作的底层基础设施。

与此同时，Anthropic秘密向SEC提交了S-1文件，计划进行IPO。这一举动标志着前沿AI从私人市场神话走向公开市场问责。收入质量、计算承诺、利润率、治理和安全声明将不得不面对投资者、监管机构和季度报告的严格审视。

NVIDIA则在两个方向推动了前沿发展。Cosmos推进了物理AI的世界基础模型，能够处理视频、仿真、机器人技术和具身环境。Nemotron 3 Ultra扩展了NVIDIA的企业模型栈，适用于复杂的推理和智能体工作流。这表明NVIDIA不仅出售AI淘金热中的“铲子”，更希望定义构建机器人、智能体、仿真和企业的地形。

最后，据报道DeepSeek即将完成约74亿美元的融资，由腾讯、宁德时代和创始人领投，估值在520至590亿美元之间。这一事件再次提醒，开源模型竞赛正成为地缘政治基础设施。资本、能源、芯片、人才和产业政策正围绕前沿实验室汇聚，开源模型已不再是纯粹的工程哲学，而是战略资产。

综合来看，本周的故事是AI离开演示页面的写照：它正在玩游戏、管理工作流、提交IPO、模拟物理世界并吸引国家级资本。问题不再是哪个聊天机器人最好，而是哪些系统能在充满挑战的环境中行动、适应并赢得信任。基准测试告诉了我们模型如何回答，而竞技场将告诉我们它们如何表现。