AI News HubLIVE
站内改写2 分钟阅读

LWiAI播客第245期 - TML交互、法律界Claude、Sam Altman出庭

本期播客总结了上周AI领域的重要新闻,包括OpenAI发布新的语音智能API功能、Thinking Machines推出高响应实时交互模型、Anthropic进军法律科技领域推出Claude for Legal、以及Sam Altman在庭审中的表现等话题。

来源Last Week in AI作者: Last Week in AI

在本期LWiAI播客中,主持人Andrey Kurenkov和Jeremie Harris深入探讨了上周AI领域的多项重要进展,涵盖了从API更新到模型发布、从法律科技到灰色市场交易等多个方面。

首先,OpenAI发布了新的语音智能API功能,其中包括基于GPT-5的GPT Realtime 2、实时翻译和Whisper转录。这些功能强调了延迟与推理能力之间的权衡,并引入了更大的上下文窗口(高达256K tokens)以及新的安全护栏,旨在应对潜在的欺诈风险。OpenAI特别指出,这些API设计上允许开发者根据应用场景调整延迟和推理深度,例如在实时对话中追求低延迟,而在需要复杂推理的任务中则更注重准确性。此外,新功能还支持语音活动检测和中断处理,使得交互更加自然。

接着,Thinking Machines展示了一个低延迟、全双工的对话系统,采用双模型架构(一个用于实时处理,一个用于深度理解)和定制推理栈。该公司宣称在交互性基准测试中取得了显著成绩,但目前尚未向公众开放,也缺乏第三方独立验证。这一发布引发了关于实时AI交互可用性的讨论,但需等待更多实际评估。

Anthropic继续向垂直产品领域扩展,推出了Claude for Legal,这是一套专门针对法律行业的工具,包括合同分析、法律研究、案件摘要等功能。同时,Anthropic加深了与AWS的合作,在AWS上推出了Claude Platform,提供更便捷的模型访问和部署选项。这一举措加剧了平台模型提供商(如Anthropic和OpenAI)与应用层公司之间的生态系统紧张关系,因为前者开始直接提供面向特定行业的解决方案。

在政策与安全方面,OpenAI引入了自我伤害可信联系人功能,允许用户在ChatGPT中设置紧急联系人,当检测到自我伤害风险时自动通知。Anthropic研究了通过训练伦理“为什么”推理来减少代理错误对齐,即让模型在行动前解释其道德理由,从而减少有害行为。OpenAI还调查了强化学习中意外对思维链(CoT)进行评分的问题,发现这可能导致模型过度优化中间推理步骤而忽略最终结果。Meta的地平线评估更新则显示了长任务基准的局限性,特别是对于需要长期规划的任务,现有评估方法可能无法准确衡量模型能力。

其他话题包括:Sam Altman在法庭上的表现,他在一起有关AI安全诉讼中作证,虽然表现自信但可能不足以扭转局势;Nvidia CEO黄仁勋受邀与特朗普一同访华,探讨芯片合作;中国灰色市场通过被盗凭证以90%折扣出售Claude API访问权,并窃取用户提示和输出用于再训练;DeepMind衍生公司Isomorphic Labs融资21亿美元,利用AI设计药物;此外,乔治·克鲁尼、汤姆·汉克斯和梅丽尔·斯特里普等明星支持新的AI许可“人类同意标准”,要求在使用明星形象训练AI时获得明确同意。

研究方面,METR发布报告称Claude Mythos正在测试AI评估的极限,指出当前的评估方法可能不足以衡量前沿模型的真实能力。播客还讨论了自然语言自编码器、Anthropic的自动化研发风险报告等研究进展。总体而言,本期内容丰富,涵盖了从产品发布到安全研究的广泛话题,反映了AI领域的快速演变和日益复杂的生态。