LWiAI播客第237期:Nemotron 3 Super、xAI重組、Anthropic訴訟、更多研究動態!
本期播客回顧上週AI重大新聞,包括Perplexity推出本地Mac AI代理、Anthropic代碼審查工具、ChatGPT交互式數學/科學可視化、Nvidia發佈120B參數Natron Free Super混合模型、Nvidia暫停H200對華出貨、xAI聯合創始人離職、Anthropic起訴五角大樓等。
在本期LWiAI播客中,主持人Andrey Kurenkov和Jeremie Harris詳細討論了上週AI領域的多項重大新聞。首先,Perplexity推出了名為“Personal Computer”的本地Mac AI代理,旨在提供比OpenAI的計算機使用代理更安全的替代方案。與此同時,Anthropic推出了GitHub PR代碼審查工具,定價為每條PR 15至25美元,而Cursor則推出了基於觸發器的“Automations”功能,支持始終在線的編碼代理。
在模型發佈方面,Nvidia發佈了其120B參數的Natron Free Super模型,這是一個混合Transformer-Mamba的潛在MoE模型,專為Blackwell GPU設計並原生以4位精度訓練。該模型在代理推理任務上表現出色。此外,Nvidia因海關封鎖和國內芯片競爭壓力暫停了H200對中國的生產。
xAI方面,又一位聯合創始人離職,另一位也表示即將離開,引發了對公司未來的討論。Anthropic則推出了Claude Marketplace,允許企業客户購買第三方雲服務。Yann LeCun的AMI Labs成功融資13億美元,用於開發世界模型。人形機器人制造商Sanctuary估值達到11.5億美元,致力於家用機器人研發。
在政策與安全領域,Anthropic起訴美國國防部,反對其將Anthropic列為“供應鏈風險”的決定,並指出內部備忘錄要求軍事指揮官在180天內移除相關係統。谷歌和OpenAI也提交了法律簡報支持Anthropic。此外,播客還討論了多項研究論文,包括語言模型對激活引導的抵抗、推理模型難以控制思考鏈、推理縮放定律在網絡任務中的有效性、低概率下的風險行為、SWE-bench的侷限性、多模態預訓練、長上下文RNN記憶緩存、上下文並行訓練效率、強化學習優化CUDA內核,以及潛在內省檢測概念注入等。
本期播客內容豐富,涵蓋了從工具應用到前沿研究的多個方面,為聽眾提供了全面的AI新聞回顧。