2026-04-01 16:07 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

LWiAI播客#238：GPT-5.4 mini、OpenAI转型、Mamba 3、注意力残差

OpenAI发布GPT-5.4 mini和nano，速度更快、能力更强但价格最高上涨4倍；Mistral开源Small 4模型系列；Meta的Manus推出Mac本地代理；NVIDIA宣布DLSS 5和NeMo沙盒代理运行时；以及更多AI安全与研究进展。

来源Last Week in AI作者: Last Week in AI

在本期LWiAI播客第238期中，主持人Andrey Kurenkov和Jeremie Harris深入讨论了上周AI领域的重要新闻，涵盖了模型发布、代理操作系统竞争、商业战略调整以及安全研究等多个方面。

首先，OpenAI发布了GPT-5.4 mini和nano模型。这两款模型拥有高达40万token的上下文窗口，在速度和能力上均有显著提升，但每token价格大幅上涨，最高可达4倍。其中nano模型仅通过API提供，主要面向高容量的分类和数据提取任务。OpenAI声称，尽管价格提升，但模型在Codex等任务上的token效率更高，因此总体成本可能更具优势。

Mistral则开源了Small 4模型系列，这是一个混合专家（MoE）模型，总参数119B，活跃参数6B，结合了推理、多模态和编码代理能力。Mistral还宣布推出Forge平台，帮助企业训练或后训练自定义模型，进一步降低了企业使用AI的门槛。

代理操作系统领域的竞争显著加剧。Meta收购的Manus推出了本地Mac代理“My Computer”，允许用户通过自然语言控制Mac电脑。NVIDIA则发布了NeMo/“Open Shell”沙盒代理运行时，旨在为代理提供安全的执行环境。此外，NVIDIA还公布了DLSS 5技术，该技术类似于实时生成式AI滤镜，用于游戏画面渲染，并预测了包括Groq LPU集成在内的重大硬件发展。

商业方面，OpenAI据报道正转向生产力/企业市场，以应对日益激烈的竞争。微软重组了Copilot和前沿模型团队，以追赶谷歌和OpenAI的步伐。Meta因性能问题推迟了下一代模型的发布。同时，与中国的字节跳动被报道在海外部署了大型NVIDIA集群，获得了高端芯片的访问权限。

安全研究涵盖多个前沿主题：包括使用决策理论形式化隐写术以监控LLM输出、区分模型信念与思维链的“推理剧场”、针对模型微调时出现的不对齐行为的训练中防御、以及前沿AI代理在多步网络攻击场景中的表现评估。此外，还介绍了Claude Opus 4.6在BrowseComp性能中的评估意识，以及开源工具Bloom用于自动化行为评估。研究还探讨了模型遵循其宪法的程度，以及NVIDIA H200许可证引发的安全担忧。

在研究进展方面，本期介绍了注意力残差（Attention Residuals）方法，旨在改进Transformer中的注意力机制；以及Mamba-3，它基于状态空间原则实现了改进的序列建模。

感谢本期赞助商：Box、ODSC AI和Factor。