LWiAI ポッドキャスト #235:Sonnet 4.6、深層思考トークン、Anthropic対ペンタゴン
第235回Last Week in AIでは、AnthropicのSonnet 4.6(100万トークンのコンテキスト、ARC-AGI-2での好成績)、GoogleのGemini 3.1 Pro、xAIのGrok 4.2ベータ版、各種ツールアップデートを取り上げます。ビジネスニュースでは、Metaの最大1000億ドルのAMDチップ取引、MatXの5億ドル調達、World Labsの10億ドル、Simileの1億ドルを取り上げます。研究では深層思考トークン、マスキング更新、LLMアトラクター状態が注目されます。政策議論では、Anthropicのペンタゴン契約に対する姿勢と蒸留攻撃に焦点を当てます。
Last Week in AI(LWiAI)ポッドキャスト第235回は2026年2月27日に収録され、Andrey KurenkovとJeremie Harrisがホストを務めました。今回のエピソードでは、先週のAI分野における重要なニュースを包括的にカバーしました。
モデルとツールのアップデートでは、AnthropicがSonnet 4.6をリリースし、コンテキストウィンドウを100万トークンに拡大、ARC-AGI-2ベンチマークで顕著な成果を上げました。GoogleはGemini 3.1 Proを発表し、音声、画像、動画などのマルチモーダル能力が大幅に向上、ARC-AGI-2でも大きな進歩を示しました。xAIのGrok 4.2ベータ版はマルチエージェント討論機能を導入しました。また、AnthropicはClaude Codeのモバイル版「Remote Control」を、Perplexityはマルチエージェントコーディネーター「Computer」をリリースし、他のAIエージェントにタスクを割り当てることができます。
ビジネスと計算リソースの分野では、MetaがAMDと最大1000億ドルのチップ取引を交渉中であると報じられ、ワラントや株式インセンティブが含まれる可能性があります。AIチップスタートアップのMatXは5億ドルを調達し、2027年に出荷予定の専用Transformerチップを開発中です。World LabsはAutodeskなどの投資家から10億ドルを調達し、ワールドモデルを3Dワークフローに統合することを目指しています。別のスタートアップSimileは1億ドルを調達し、人間の行動をシミュレート・予測する技術を開発中です。インフラ面では、Stargate AIデータセンタープロジェクトがOpenAI、Oracle、SoftBank間の管理権争いと資金問題で遅延しています。中国は今後2年間で7nmおよび5nmのウェーハ生産量を5倍に増やし、2030年までに月間50万枚を目標としています。
研究進展では、適応的オプティマイザーにおけるマスキング更新の有効性を探る研究が注目されました。別の論文では「深層思考トークン」概念を導入し、大規模言語モデル(LLM)の推論努力を測定する指標として提案されました。研究者らはまた、ボット間対話におけるLLMのアトラクター状態行動を観察しました。幾何学的分析が計数タスクのメカニズム理解に応用されました。さらに、タスクの難易度を人間の完了時間にマッピングする手法が提案されました。
政策と安全性に関して、AnthropicのCEO Amodeiは、ペンタゴンの脅威は「当社の立場を変えるものではない」と述べましたが、イーロン・マスクのxAIはペンタゴンと機密システムへのGrok使用契約を結びました。AnthropicはDeepSeek、Moonshot、Minimaxなどのモデルに対する蒸留攻撃に関するレポートを公開しました。OpenAIも悪意のあるAI使用を防止する取り組みを詳述した新たなレポートを発表しました。