LWiAI 播客 #236 - GPT 5.4, Gemini 3.1 Flash Lite, 供應鏈風險
本期節目回顧了上週AI領域的重要新聞:OpenAI釋出GPT-5.4 Pro和GPT-5.3 Instant,Google推出Gemini 3.1 Flash Lite,Luma釋出統一多模態模型,以及Anthropic被列入國防供應鏈風險名單引發的爭議。
在最新一期的LWiAI播客中,主持人Andrey Kurenkov和Jeremie Harris回顧了上週AI領域的重大新聞。首先,OpenAI釋出了GPT-5.4 Pro,該模型擁有100萬token的上下文視窗,支援中途糾正、原生計算機使用能力,以及改進的工具使用。在GPT-VAL基準測試中,其效能達到83%,並配備了“高網路能力”安全措施。同時,OpenAI還推出了GPT-5.3 Instant,語氣更直接,聲稱幻覺率降低26.8%。
Google方面,推出了Gemini 3.1 Flash Lite,其成本僅為Pro版本的八分之一,具有更快的首token時間和更高的吞吐量。此外,Google還發布了CLI工具,使Gmail、Drive和Docs能夠整合代理功能,但討論中也指出了現實世界中代理失敗的風險,例如AI誤刪大量郵件的案例。
Luma推出了統一多模態模型和Luma Agents,能夠跨文本、影像、影片和音訊完成端到端創意工作。據報道,一個廣告本地化案例在40小時內完成,成本不到2萬美元。
國防合同爭議成為本期焦點。Anthropic被標記為供應鏈風險(後來範圍縮小),OpenAI的國防部合同語言強調“所有合法用途”,消費者取消訂閱使Claude應用排名上升。OpenAI內部出現離職,並宣佈以7300億美元估值融資1100億美元。阿里巴巴失去了Qwen技術負責人,一起訴訟指控Gemini助長自殺,Anthropic警告大規模勞動力 disruption,METR糾正了其AI時間 horizon 估計。
本期節目還感謝了贊助商Box、ODSC AI、Factor,並預告了Astrocade的招聘資訊。