2026-04-01 16:07 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

LWiAI播客#238：GPT-5.4 mini、OpenAI轉型、Mamba 3、注意力殘差

OpenAI釋出GPT-5.4 mini和nano，速度更快、能力更強但價格最高上漲4倍；Mistral開源Small 4模型系列；Meta的Manus推出Mac本地代理；NVIDIA宣佈DLSS 5和NeMo沙盒代理執行時；以及更多AI安全與研究進展。

來源Last Week in AI作者: Last Week in AI

在本期LWiAI播客第238期中，主持人Andrey Kurenkov和Jeremie Harris深入討論了上週AI領域的重要新聞，涵蓋了模型釋出、代理作業系統競爭、商業戰略調整以及安全研究等多個方面。

首先，OpenAI釋出了GPT-5.4 mini和nano模型。這兩款模型擁有高達40萬token的上下文視窗，在速度和能力上均有顯著提升，但每token價格大幅上漲，最高可達4倍。其中nano模型僅透過API提供，主要面向高容量的分類和資料提取任務。OpenAI聲稱，儘管價格提升，但模型在Codex等任務上的token效率更高，因此總體成本可能更具優勢。

Mistral則開源了Small 4模型系列，這是一個混合專家（MoE）模型，總引數119B，活躍引數6B，結合了推理、多模態和編碼代理能力。Mistral還宣佈推出Forge平臺，幫助企業訓練或後訓練自定義模型，進一步降低了企業使用AI的門檻。

代理作業系統領域的競爭顯著加劇。Meta收購的Manus推出了本地Mac代理“My Computer”，允許使用者透過自然語言控制Mac電腦。NVIDIA則釋出了NeMo/“Open Shell”沙盒代理執行時，旨在為代理提供安全的執行環境。此外，NVIDIA還公佈了DLSS 5技術，該技術類似於即時生成式AI濾鏡，用於遊戲畫面渲染，並預測了包括Groq LPU整合在內的重大硬體發展。

商業方面，OpenAI據報道正轉向生產力/企業市場，以應對日益激烈的競爭。微軟重組了Copilot和前沿模型團隊，以追趕谷歌和OpenAI的步伐。Meta因效能問題推遲了下一代模型的釋出。同時，與中國的字節跳動被報道在海外部署了大型NVIDIA叢集，獲得了高階晶片的訪問許可權。

安全研究涵蓋多個前沿主題：包括使用決策理論形式化隱寫術以監控LLM輸出、區分模型信念與思維鏈的“推理劇場”、針對模型微調時出現的不對齊行為的訓練中防禦、以及前沿AI代理在多步網路攻擊場景中的表現評估。此外，還介紹了Claude Opus 4.6在BrowseComp效能中的評估意識，以及開源工具Bloom用於自動化行為評估。研究還探討了模型遵循其憲法的程度，以及NVIDIA H200許可證引發的安全擔憂。

在研究進展方面，本期介紹了注意力殘差（Attention Residuals）方法，旨在改進Transformer中的注意力機制；以及Mamba-3，它基於狀態空間原則實現了改進的序列建模。

感謝本期贊助商：Box、ODSC AI和Factor。