2026-03-13 13:38 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

LWiAI 播客 #236 - GPT 5.4, Gemini 3.1 Flash Lite, 供應鏈風險

本期節目回顧了上週AI領域的重要新聞：OpenAI釋出GPT-5.4 Pro和GPT-5.3 Instant，Google推出Gemini 3.1 Flash Lite，Luma釋出統一多模態模型，以及Anthropic被列入國防供應鏈風險名單引發的爭議。

來源Last Week in AI作者: Last Week in AI

文章情報

工程師入門

要點

OpenAI 釋出 GPT-5.4 Pro，支援100萬token上下文視窗，並推出語氣更直接的 GPT-5.3 Instant，聲稱減少26.8%的幻覺。
Google 推出 Gemini 3.1 Flash Lite，成本僅為Pro版本的八分之一，並開放Gmail、Drive等代理介面。
Luma 釋出統一多模態模型和Luma Agents，能夠跨文本、影像、影片、音訊完成創意工作。
Anthropic 被短暫標記為國防供應鏈風險，引發關於AI軍事合同的廣泛討論。

為什麼重要

這條新聞值得關注，因為OpenAI 釋出 GPT-5.4 Pro，支援100萬token上下文視窗，並推出語氣更直接的 GPT-5.3 Instant，聲稱減少26.8%的幻覺。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

本面板由 AI 生成，經人工審核。

在最新一期的LWiAI播客中，主持人Andrey Kurenkov和Jeremie Harris回顧了上週AI領域的重大新聞。首先，OpenAI釋出了GPT-5.4 Pro，該模型擁有100萬token的上下文視窗，支援中途糾正、原生計算機使用能力，以及改進的工具使用。在GPT-VAL基準測試中，其效能達到83%，並配備了“高網路能力”安全措施。同時，OpenAI還推出了GPT-5.3 Instant，語氣更直接，聲稱幻覺率降低26.8%。

Google方面，推出了Gemini 3.1 Flash Lite，其成本僅為Pro版本的八分之一，具有更快的首token時間和更高的吞吐量。此外，Google還發布了CLI工具，使Gmail、Drive和Docs能夠整合代理功能，但討論中也指出了現實世界中代理失敗的風險，例如AI誤刪大量郵件的案例。

Luma推出了統一多模態模型和Luma Agents，能夠跨文本、影像、影片和音訊完成端到端創意工作。據報道，一個廣告本地化案例在40小時內完成，成本不到2萬美元。

國防合同爭議成為本期焦點。Anthropic被標記為供應鏈風險（後來範圍縮小），OpenAI的國防部合同語言強調“所有合法用途”，消費者取消訂閱使Claude應用排名上升。OpenAI內部出現離職，並宣佈以7300億美元估值融資1100億美元。阿里巴巴失去了Qwen技術負責人，一起訴訟指控Gemini助長自殺，Anthropic警告大規模勞動力 disruption，METR糾正了其AI時間 horizon 估計。

本期節目還感謝了贊助商Box、ODSC AI、Factor，並預告了Astrocade的招聘資訊。