2026-03-13 13:38 UTC+8站内改写1 分钟阅读更新: 2026-06-27 08:25 UTC+8

LWiAI 播客 #236 - GPT 5.4, Gemini 3.1 Flash Lite, 供应链风险

本期节目回顾了上周AI领域的重要新闻：OpenAI发布GPT-5.4 Pro和GPT-5.3 Instant，Google推出Gemini 3.1 Flash Lite，Luma发布统一多模态模型，以及Anthropic被列入国防供应链风险名单引发的争议。

来源Last Week in AI作者: Last Week in AI

文章情报

工程师入门

要点

OpenAI 发布 GPT-5.4 Pro，支持100万token上下文窗口，并推出语气更直接的 GPT-5.3 Instant，声称减少26.8%的幻觉。
Google 推出 Gemini 3.1 Flash Lite，成本仅为Pro版本的八分之一，并开放Gmail、Drive等代理接口。
Luma 发布统一多模态模型和Luma Agents，能够跨文本、图像、视频、音频完成创意工作。
Anthropic 被短暂标记为国防供应链风险，引发关于AI军事合同的广泛讨论。

为什么重要

这条新闻值得关注，因为OpenAI 发布 GPT-5.4 Pro，支持100万token上下文窗口，并推出语气更直接的 GPT-5.3 Instant，声称减少26.8%的幻觉。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

本面板由 AI 生成，经人工审核。

在最新一期的LWiAI播客中，主持人Andrey Kurenkov和Jeremie Harris回顾了上周AI领域的重大新闻。首先，OpenAI发布了GPT-5.4 Pro，该模型拥有100万token的上下文窗口，支持中途纠正、原生计算机使用能力，以及改进的工具使用。在GPT-VAL基准测试中，其性能达到83%，并配备了“高网络能力”安全措施。同时，OpenAI还推出了GPT-5.3 Instant，语气更直接，声称幻觉率降低26.8%。

Google方面，推出了Gemini 3.1 Flash Lite，其成本仅为Pro版本的八分之一，具有更快的首token时间和更高的吞吐量。此外，Google还发布了CLI工具，使Gmail、Drive和Docs能够集成代理功能，但讨论中也指出了现实世界中代理失败的风险，例如AI误删大量邮件的案例。

Luma推出了统一多模态模型和Luma Agents，能够跨文本、图像、视频和音频完成端到端创意工作。据报道，一个广告本地化案例在40小时内完成，成本不到2万美元。

国防合同争议成为本期焦点。Anthropic被标记为供应链风险（后来范围缩小），OpenAI的国防部合同语言强调“所有合法用途”，消费者取消订阅使Claude应用排名上升。OpenAI内部出现离职，并宣布以7300亿美元估值融资1100亿美元。阿里巴巴失去了Qwen技术负责人，一起诉讼指控Gemini助长自杀，Anthropic警告大规模劳动力 disruption，METR纠正了其AI时间 horizon 估计。

本期节目还感谢了赞助商Box、ODSC AI、Factor，并预告了Astrocade的招聘信息。