LWiAI播客第243期:GPT-5.5、DeepSeek V4、AI安全破坏
本期播客回顾了上周AI领域的重要新闻,包括OpenAI发布GPT-5.5、xAI推出Grok Voice Think Fast 1.0、DeepSeek开源V4模型、Google计划向Anthropic投资高达400亿美元等。此外还讨论了AI安全研究中的破坏行为、文档委托腐蚀等新研究。
文章情报
要点
- OpenAI发布GPT-5.5,显著提升编码能力,系统卡讨论了思维链可监控性和对齐测试
- xAI推出Grok Voice Think Fast 1.0,在实时语音代理基准测试中领先
- DeepSeek开源V4模型,采用MoE扩展和100万 token上下文
- Google计划向Anthropic投资高达400亿美元,Meta将使用AWS Graviton芯片
为什么重要
这条新闻值得关注,因为OpenAI发布GPT-5.5,显著提升编码能力,系统卡讨论了思维链可监控性和对齐测试。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
在最新一期LWiAI播客(第243期)中,主持人Andrey Kurenkov和Jeremie Harris深入探讨了上周AI领域的重大新闻。节目录制于2026年4月29日,涵盖模型发布、商业动态、政策安全等多个方面。
首先,OpenAI发布了GPT-5.5模型,该模型在编码任务上实现了显著改进,并附带一份系统卡,详细说明了思维链的可监控性和对齐测试情况。相比GPT-5.4,新模型定价更高,且包含一些奇特之处,如系统提示中关于“妖精”的警告。
xAI推出了Grok Voice Think Fast 1.0,声称在实时语音代理基准测试中大幅领先,并报告了在Starlink客户支持自动化和销售转化方面的显著影响。此外,Anthropic的Claude现已直接集成到Photoshop、Blender和Ableton等创意工具中。
在开源模型方面,DeepSeek发布了V4预览版(Pro和Flash),采用混合专家(MoE)架构扩展,并通过混合/压缩注意力机制实现了100万 token的上下文窗口。腾讯则推出了Hunyuan 3预览版,但基准测试表现较弱。同时,新基准Clawmark显示,长期代理任务的成功率仍然很低。
商业与政策方面,Google计划向Anthropic投资高达400亿美元,并承诺提供5 GW算力。Meta将使用数十万个AWS Graviton芯片,但中国阻止了Meta收购AI初创公司Manus。OpenAI与微软的合作关系也进行了调整,限制了收入分成支付。Elon Musk在审判中作证,称OpenAI试图“窃取”慈善机构。此外,美国法官拒绝了司法部延迟Anthropic在五角大楼争议中上诉的请求。
安全研究方面,一项新研究评估了AI模型是否会破坏AI安全研究,另一项研究揭示了委托任务时文档可能被腐蚀。此外,还讨论了时序稀疏自编码器、美国AI模型对抗性蒸馏备忘录、青少年与AI聊天机器人约会等现象。
最后,Taylor Swift提交了声音和肖像的商标申请,以防范AI滥用。研究方面,一篇论文探讨了无需数据或优化的最大脑损伤方法,通过符号位翻转破坏神经网络。