LWiAI 播客 #236 - GPT 5.4, Gemini 3.1 Flash Lite, 供应链风险
本期节目回顾了上周AI领域的重要新闻:OpenAI发布GPT-5.4 Pro和GPT-5.3 Instant,Google推出Gemini 3.1 Flash Lite,Luma发布统一多模态模型,以及Anthropic被列入国防供应链风险名单引发的争议。
在最新一期的LWiAI播客中,主持人Andrey Kurenkov和Jeremie Harris回顾了上周AI领域的重大新闻。首先,OpenAI发布了GPT-5.4 Pro,该模型拥有100万token的上下文窗口,支持中途纠正、原生计算机使用能力,以及改进的工具使用。在GPT-VAL基准测试中,其性能达到83%,并配备了“高网络能力”安全措施。同时,OpenAI还推出了GPT-5.3 Instant,语气更直接,声称幻觉率降低26.8%。
Google方面,推出了Gemini 3.1 Flash Lite,其成本仅为Pro版本的八分之一,具有更快的首token时间和更高的吞吐量。此外,Google还发布了CLI工具,使Gmail、Drive和Docs能够集成代理功能,但讨论中也指出了现实世界中代理失败的风险,例如AI误删大量邮件的案例。
Luma推出了统一多模态模型和Luma Agents,能够跨文本、图像、视频和音频完成端到端创意工作。据报道,一个广告本地化案例在40小时内完成,成本不到2万美元。
国防合同争议成为本期焦点。Anthropic被标记为供应链风险(后来范围缩小),OpenAI的国防部合同语言强调“所有合法用途”,消费者取消订阅使Claude应用排名上升。OpenAI内部出现离职,并宣布以7300亿美元估值融资1100亿美元。阿里巴巴失去了Qwen技术负责人,一起诉讼指控Gemini助长自杀,Anthropic警告大规模劳动力 disruption,METR纠正了其AI时间 horizon 估计。
本期节目还感谢了赞助商Box、ODSC AI、Factor,并预告了Astrocade的招聘信息。