LWiAI播客第237期:Nemotron 3 Super、xAI重组、Anthropic诉讼、更多研究动态!
本期播客回顾上周AI重大新闻,包括Perplexity推出本地Mac AI代理、Anthropic代码审查工具、ChatGPT交互式数学/科学可视化、Nvidia发布120B参数Natron Free Super混合模型、Nvidia暂停H200对华出货、xAI联合创始人离职、Anthropic起诉五角大楼等。
在本期LWiAI播客中,主持人Andrey Kurenkov和Jeremie Harris详细讨论了上周AI领域的多项重大新闻。首先,Perplexity推出了名为“Personal Computer”的本地Mac AI代理,旨在提供比OpenAI的计算机使用代理更安全的替代方案。与此同时,Anthropic推出了GitHub PR代码审查工具,定价为每条PR 15至25美元,而Cursor则推出了基于触发器的“Automations”功能,支持始终在线的编码代理。
在模型发布方面,Nvidia发布了其120B参数的Natron Free Super模型,这是一个混合Transformer-Mamba的潜在MoE模型,专为Blackwell GPU设计并原生以4位精度训练。该模型在代理推理任务上表现出色。此外,Nvidia因海关封锁和国内芯片竞争压力暂停了H200对中国的生产。
xAI方面,又一位联合创始人离职,另一位也表示即将离开,引发了对公司未来的讨论。Anthropic则推出了Claude Marketplace,允许企业客户购买第三方云服务。Yann LeCun的AMI Labs成功融资13亿美元,用于开发世界模型。人形机器人制造商Sanctuary估值达到11.5亿美元,致力于家用机器人研发。
在政策与安全领域,Anthropic起诉美国国防部,反对其将Anthropic列为“供应链风险”的决定,并指出内部备忘录要求军事指挥官在180天内移除相关系统。谷歌和OpenAI也提交了法律简报支持Anthropic。此外,播客还讨论了多项研究论文,包括语言模型对激活引导的抵抗、推理模型难以控制思考链、推理缩放定律在网络任务中的有效性、低概率下的风险行为、SWE-bench的局限性、多模态预训练、长上下文RNN记忆缓存、上下文并行训练效率、强化学习优化CUDA内核,以及潜在内省检测概念注入等。
本期播客内容丰富,涵盖了从工具应用到前沿研究的多个方面,为听众提供了全面的AI新闻回顾。