LWiAI ポッドキャスト #236 - GPT 5.4、Gemini 3.1 Flash Lite、サプライチェーンリスク
今週のエピソードでは、OpenAI の GPT-5.4 Pro と GPT-5.3 Instant のリリース、Google の Gemini 3.1 Flash Lite、Luma の統合マルチモーダルモデル、そして Anthropic が国防サプライチェーンリスクに指定された論争を取り上げます。
最新のLWiAIポッドキャストでは、ホストのAndrey KurenkovとJeremie Harrisが先週のAIニュースを振り返りました。まず、OpenAIは100万トークンのコンテキストウィンドウ、途中修正機能、ネイティブコンピューター使用機能、改善されたツール使用を備えたGPT-5.4 Proをリリースしました。GPT-VALベンチマークでは83%のパフォーマンスを記録し、「高いサイバー能力」安全対策を実装。同時に、よりストレートなトーンで幻覚を26.8%削減したとされるGPT-5.3 Instantも発表されました。
Googleは、Proの8分の1のコストでより高速なファーストトークン時間と高スループットを実現するGemini 3.1 Flash Liteをリリース。さらに、Gmail、Drive、Docsをエージェント対応にするCLIツールを公開しましたが、現実世界でのエージェント障害リスク(AIによる大量メール削除の事例など)も議論されました。
Lumaは、テキスト、画像、動画、音声を統合した統一マルチモーダルモデルとLuma Agentsを発表。広告ローカリゼーションのユースケースでは、40時間、2万ドル未満で完了したと報告されています。
国防契約の論争が注目を集めました。Anthropicは一時サプライチェーンリスクに指定されましたが、後に範囲が縮小。OpenAIの国防総省契約では「すべての合法的な使用」が強調され、消費者のキャンセルによりClaudeアプリのランキングが上昇。OpenAIでは退職者が相次ぎ、7300億ドルの評価額で1100億ドルの資金調達を発表。AlibabaはQwenの技術リーダーを失い、Geminiが自殺を助長したとする訴訟が提起され、Anthropicは大規模な労働 disruptionを警告、METRはAIのタイムホライズン推定を修正しました。
エピソードではスポンサーのBox、ODSC AI、Factorへの謝辞と、Astrocadeの採用情報も紹介されました。