AI News HubLIVE
站内改写

LWiAIポッドキャスト #243 – GPT 5.5、DeepSeek V4、AI安全性の妨害

第243回エピソードでは、先週の主要AIニュースを要約し議論。OpenAIのGPT-5.5、xAIのGrok Voice Think Fast 1.0、DeepSeek V4のオープンソース化、GoogleのAnthropicへの巨額投資、妨害行為やドキュメント劣化に関する安全性研究などを取り上げた。

記事インテリジェンス

エンジニア上級

要点

  • OpenAIがGPT-5.5を公開、コーディング能力が大幅に向上し、思考連鎖の監視可能性に関するシステムカードを同梱
  • xAIがGrok Voice Think Fast 1.0を発表、リアルタイム音声エージェントベンチマークでリード
  • DeepSeekがV4をオープンソース化、MoEスケーリングと100万トークンコンテキストを実現
  • GoogleがAnthropicに最大400億ドル投資、MetaはAWS Gravitonチップを数十万個使用へ

重要な理由

このニュースが重要なのは、OpenAIがGPT-5.5を公開、コーディング能力が大幅に向上し、思考連鎖の監視可能性に関するシステムカードを同梱ためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

最新のLWiAIポッドキャスト(第243回)では、ホストのAndrey KurenkovとJeremie Harrisが先週の主要なAIニュースについて深く掘り下げました。録音は2026年4月29日に行われ、モデルリリース、ビジネス動向、政策・安全性など多岐にわたるトピックをカバーしました。

まず、OpenAIはGPT-5.5をリリースしました。このモデルはコーディングタスクで顕著な改善を示し、思考連鎖の監視可能性やアライメントテストに関するシステムカードが付属しています。GPT-5.4よりも価格が高く、システムプロンプトに「ゴブリン」に関する警告があるなど、特異な点も見られます。

xAIはGrok Voice Think Fast 1.0を発表し、リアルタイム音声エージェントのベンチマークで大きなリードを主張しています。Starlinkのカスタマーサポート自動化や売上転換において大きな影響があったと報告されています。また、AnthropicのClaudeはPhotoshop、Blender、Abletonなどのクリエイティブツールに直接統合されました。

オープンソースモデルでは、DeepSeekがV4のプレビュー版(ProおよびFlash)を公開しました。混合専門家(MoE)アーキテクチャを採用し、ハイブリッド/圧縮アテンション機構により100万トークンのコンテキストウィンドウを実現しています。TencentはHunyuan 3プレビューをリリースしましたが、ベンチマーク性能は弱めです。また、新しい長期エージェントベンチマークClawmarkは、タスク成功率が依然として低いことを示しています。

ビジネスおよび政策面では、GoogleがAnthropicに最大400億ドルの投資と5GWの計算能力コミットメントを計画しています。Metaは数十万個のAWS Gravitonチップを使用し、中国はMetaによるAIスタートアップManusの買収を阻止しました。OpenAIとMicrosoftのパートナーシップも修正され、収益分配の上限が設定されました。Elon Muskは裁判で証言し、OpenAIが慈善団体を「盗もう」としたと主張しました。また、裁判官は国防総省紛争におけるAnthropicの控訴を遅らせる司法省の申し立てを却下しました。

安全性研究では、AIモデルがAI安全研究を妨害するかどうかを評価する研究や、委任時にドキュメントが劣化する現象を明らかにした研究が発表されました。さらに、時空間スパースオートエンコーダ、アメリカのAIモデルに対する敵対的蒸留に関する覚書、10代の若者がAIチャットボットと交際する現象などが議論されました。

最後に、Taylor SwiftはAI悪用から守るために声と肖像の商標を出願しました。研究分野では、データや最適化なしに符号ビット反転でニューラルネットワークを破壊する手法が紹介されました。