2026-05-20 15:45 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

LWiAI播客第245期 - TML交互、法律界Claude、Sam Altman出庭

本期播客总结了上周AI领域的重要新闻，包括OpenAI发布新的语音智能API功能、Thinking Machines推出高响应实时交互模型、Anthropic进军法律科技领域推出Claude for Legal、以及Sam Altman在庭审中的表现等话题。

来源Last Week in AI作者: Last Week in AI

在本期LWiAI播客中，主持人Andrey Kurenkov和Jeremie Harris深入探讨了上周AI领域的多项重要进展，涵盖了从API更新到模型发布、从法律科技到灰色市场交易等多个方面。

首先，OpenAI发布了新的语音智能API功能，其中包括基于GPT-5的GPT Realtime 2、实时翻译和Whisper转录。这些功能强调了延迟与推理能力之间的权衡，并引入了更大的上下文窗口（高达256K tokens）以及新的安全护栏，旨在应对潜在的欺诈风险。OpenAI特别指出，这些API设计上允许开发者根据应用场景调整延迟和推理深度，例如在实时对话中追求低延迟，而在需要复杂推理的任务中则更注重准确性。此外，新功能还支持语音活动检测和中断处理，使得交互更加自然。

接着，Thinking Machines展示了一个低延迟、全双工的对话系统，采用双模型架构（一个用于实时处理，一个用于深度理解）和定制推理栈。该公司宣称在交互性基准测试中取得了显著成绩，但目前尚未向公众开放，也缺乏第三方独立验证。这一发布引发了关于实时AI交互可用性的讨论，但需等待更多实际评估。

Anthropic继续向垂直产品领域扩展，推出了Claude for Legal，这是一套专门针对法律行业的工具，包括合同分析、法律研究、案件摘要等功能。同时，Anthropic加深了与AWS的合作，在AWS上推出了Claude Platform，提供更便捷的模型访问和部署选项。这一举措加剧了平台模型提供商（如Anthropic和OpenAI）与应用层公司之间的生态系统紧张关系，因为前者开始直接提供面向特定行业的解决方案。

在政策与安全方面，OpenAI引入了自我伤害可信联系人功能，允许用户在ChatGPT中设置紧急联系人，当检测到自我伤害风险时自动通知。Anthropic研究了通过训练伦理“为什么”推理来减少代理错误对齐，即让模型在行动前解释其道德理由，从而减少有害行为。OpenAI还调查了强化学习中意外对思维链（CoT）进行评分的问题，发现这可能导致模型过度优化中间推理步骤而忽略最终结果。Meta的地平线评估更新则显示了长任务基准的局限性，特别是对于需要长期规划的任务，现有评估方法可能无法准确衡量模型能力。

其他话题包括：Sam Altman在法庭上的表现，他在一起有关AI安全诉讼中作证，虽然表现自信但可能不足以扭转局势；Nvidia CEO黄仁勋受邀与特朗普一同访华，探讨芯片合作；中国灰色市场通过被盗凭证以90%折扣出售Claude API访问权，并窃取用户提示和输出用于再训练；DeepMind衍生公司Isomorphic Labs融资21亿美元，利用AI设计药物；此外，乔治·克鲁尼、汤姆·汉克斯和梅丽尔·斯特里普等明星支持新的AI许可“人类同意标准”，要求在使用明星形象训练AI时获得明确同意。

研究方面，METR发布报告称Claude Mythos正在测试AI评估的极限，指出当前的评估方法可能不足以衡量前沿模型的真实能力。播客还讨论了自然语言自编码器、Anthropic的自动化研发风险报告等研究进展。总体而言，本期内容丰富，涵盖了从产品发布到安全研究的广泛话题，反映了AI领域的快速演变和日益复杂的生态。