AI News HubLIVE
站内改写

LWiAI播客第243期:GPT-5.5、DeepSeek V4、AI安全破壞

本期播客回顧了上週AI領域的重要新聞,包括OpenAI釋出GPT-5.5、xAI推出Grok Voice Think Fast 1.0、DeepSeek開源V4模型、Google計劃向Anthropic投資高達400億美元等。此外還討論了AI安全研究中的破壞行為、文件委託腐蝕等新研究。

文章情報

投資人進階

要點

  • OpenAI釋出GPT-5.5,顯著提升編碼能力,系統卡討論了思維鏈可監控性和對齊測試
  • xAI推出Grok Voice Think Fast 1.0,在即時語音代理基準測試中領先
  • DeepSeek開源V4模型,採用MoE擴充套件和100萬 token上下文
  • Google計劃向Anthropic投資高達400億美元,Meta將使用AWS Graviton晶片

為什麼重要

這條新聞值得關注,因為OpenAI釋出GPT-5.5,顯著提升編碼能力,系統卡討論了思維鏈可監控性和對齊測試。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

在最新一期LWiAI播客(第243期)中,主持人Andrey Kurenkov和Jeremie Harris深入探討了上週AI領域的重大新聞。節目錄制於2026年4月29日,涵蓋模型釋出、商業動態、政策安全等多個方面。

首先,OpenAI釋出了GPT-5.5模型,該模型在編碼任務上實現了顯著改進,並附帶一份系統卡,詳細說明了思維鏈的可監控性和對齊測試情況。相比GPT-5.4,新模型定價更高,且包含一些奇特之處,如系統提示中關於“妖精”的警告。

xAI推出了Grok Voice Think Fast 1.0,聲稱在即時語音代理基準測試中大幅領先,並報告了在Starlink客戶支援自動化和銷售轉化方面的顯著影響。此外,Anthropic的Claude現已直接整合到Photoshop、Blender和Ableton等創意工具中。

在開源模型方面,DeepSeek釋出了V4預覽版(Pro和Flash),採用混合專家(MoE)架構擴充套件,並透過混合/壓縮注意力機制實現了100萬 token的上下文視窗。騰訊則推出了Hunyuan 3預覽版,但基準測試表現較弱。同時,新基準Clawmark顯示,長期代理任務的成功率仍然很低。

商業與政策方面,Google計劃向Anthropic投資高達400億美元,並承諾提供5 GW算力。Meta將使用數十萬個AWS Graviton晶片,但中國阻止了Meta收購AI初創公司Manus。OpenAI與微軟的合作關係也進行了調整,限制了收入分成支付。Elon Musk在審判中作證,稱OpenAI試圖“竊取”慈善機構。此外,美國法官拒絕了司法部延遲Anthropic在五角大樓爭議中上訴的請求。

安全研究方面,一項新研究評估了AI模型是否會破壞AI安全研究,另一項研究揭示了委託任務時文件可能被腐蝕。此外,還討論了時序稀疏自編碼器、美國AI模型對抗性蒸餾備忘錄、青少年與AI聊天機器人約會等現象。

最後,Taylor Swift提交了聲音和肖像的商標申請,以防範AI濫用。研究方面,一篇論文探討了無需資料或最佳化的最大腦損傷方法,透過符號位翻轉破壞神經網路。