AI News HubLIVE
サイト内リライト4 分で読了

Anthropic、米国輸出規制解除後にClaude Fable 5を7月1日再展開、新たなサイバーセキュリティ分類器を追加

Anthropicは、米国の輸出規制が解除されたことを受け、7月1日にClaude Fable 5を再展開する。新たな安全性分類器は、Amazonの報告書で示された手法を99%以上の確率でブロックし、フラグが立てられたリクエストをOpus 4.8にルーティングする。同社はまた、Amazon、Microsoft、Googleと共同で4基準のジェイルブレイク重大度フレームワークを提案した。

ソースMarkTechPost著者: Michal Sutter

Anthropicは、最も高性能な汎用モデルであるClaude Fable 5を再展開しています。6月30日、同社は米国の輸出規制が解除されたことを発表しました。この規制は以前、Claude Fable 5とClaude Mythos 5を対象としていました。Fable 5は7月1日(水曜日)にグローバルユーザー向けに復旧し、Mythos 5のアクセスは一部の米国組織に復元されました。

これらのモデルは6月12日に一時停止されました。米国政府の指令により、非外国人への使用が制限されましたが、Anthropicはリアルタイムで国籍を確認できなかったため、すべてのユーザーに対して両モデルを停止しました。本稿では、停止のトリガーとなった理由、新たなセーフガード、提案されたジェイルブレイクフレームワークについて説明し、Fable 5とGLM-5.2などの競合モデルを比較します。

クイックファクト

  • モデル: Claude Fable 5(一般利用向けに安全化されたMythos級モデル)
  • イベント: 2026年7月1日、輸出規制解除後に再展開
  • 停止理由: Amazonのレポートによるセーフガード回避手法
  • 修正: 報告された手法をブロックする新たな安全性分類器
  • 価格: 入力100万トークンあたり10ドル、出力100万トークンあたり50ドル
  • 提供場所: Claude Platform、Claude.ai、Claude Code、Claude Cowork

タイムライン Anthropicは6月9日にFable 5とMythos 5をリリースしました。両モデルは同じ基盤モデルを共有し、Fable 5は一般利用向けに強力なセーフガードを備え、Mythos 5は防御的サイバーセキュリティパートナー向けに一部のセーフガードが解除されています。6月12日、米国政府が輸出規制を適用し、即時発効しました。Anthropicはコンプライアンス違反のリスクを避けるためアクセスを停止しました。引き金となったのは、Amazonの研究者によるレポートで、Fable 5のセーフガードを回避する方法が発見されたことです。このプロンプトによりモデルは多数のソフトウェア脆弱性を特定し、1件では脆弱性を悪用するコードを生成しました。6月26日までに政府は一部の米国組織向けにMythos 5の復旧を承認し、6月30日には規制が全面解除されました。

Anthropicが発見は独自ではないと述べた理由 Anthropicは、この発見がFable 5に固有のものかどうかをテストしました。結果はそうではありませんでした。低性能のモデルでも同じ脆弱性を特定しており、Claude Opus 4.8、GPT-5.5、Kimi K2.7が含まれます。単一のエクスプロイト実証については、テストされたすべてのモデル(Haiku 4.5、Sonnet 4.6、Opus 4.6、4.7、4.8、GPT-5.4、5.5、Kimi K2.7)が再現しました。Anthropicチームは、この手法がMythos級の独自のサイバー能力を露呈したわけではなく、Fable 5のセーフガードにとっては境界事例であり、ブロックされた行動は日常的な防御的サイバーセキュリティ作業に過ぎないと述べています。

新分類器の仕組み Anthropicはそれでもこのギャップを埋めるために動きました。報告された行動に対して改良された安全性分類器をトレーニングしました。この分類器は特定の手法を99%以上のケースでブロックします。ブロックされたリクエストは直接拒否されず、代わりにClaude Opus 4.8にルーティングされ、ユーザーに通知されます。商務省CAISIの研究者は新旧のセーフガードをテストし、セーフガードは非常に強力である一方、定常的なコーディングやデバッグにおいて誤検出が増えるというトレードオフがあると同意しています。これはAnthropicの「多層防御」設計を反映しています。分類器は有害なサイバータスクを検出する小型のAIシステムであり、意図的な「安全マージン」によって一部の無害なリクエストもブロックされます。Fable 5は以前のモデルよりもはるかに大きな安全マージンを使用しています。

提案されたジェイルブレイク重大度フレームワーク この出来事は業界にギャップがあることを露呈しました。モデルのセーフガードを回避する手法である「ジェイルブレイク」を評価する共通基準がありません。AnthropicはAmazon、Microsoft、Google、その他のGlasswingパートナーと共同で草案を作成しています。この草案は4つの基準でジェイルブレイクを評価します。能力向上(ユーザーを既存のツールを超えてどこまで導くか)、能力向上の幅(どれだけ多くの異なる攻撃タスクを解放するか)、兵器化の容易さ(攻撃にまだどれだけ人間の労力が必要か)、発見可能性(手法を入手する容易さ)です。最も深刻なクラスに対しては、Anthropicは直ちに予備的な緩和策を展開し、24時間体制でジェイルブレイク提出チャネルを監視します。

ユースケースと例 Fable 5は長期的なエージェント型作業を対象としています。初期のエンジニアはコードベース移行(Stripeは5000万行のRubyコードベースの移行を1日で完了、手作業では2ヶ月以上)、金融分析(HebbiaのFinance Benchmarkで最高スコア)、ビジョンからコード(スクリーンショットからWebアプリのソースコードを再構築)、長期実行エージェント(ファイルベースのメモリにより数百万トークンにわたって集中力を維持)などに適用できます。

Fable 5の比較 一時停止により競合に機会が生まれました。停止から数日後、Zhipu AIはGLM-5.2をオープンウェイトでリリースしました。独立したテスターはこれを最も強力なオープンウェイトモデルと評価しています。GLM-5.2はMixture-of-Experts設計で、総パラメータ数は約7500億、トークンあたり約400億が活性化します。SemgrepのIDORベンチマークではF1スコア39%を記録し、同じプロンプトでClaude Codeの32%を上回りました。コスト面では、AA-BriefcaseでFable 5がタスクあたり平均31ドルだったのに対し、GLM-5.2は平均2.40ドルでした。

アクセスとAPI例 Pro、Max、Team、および一部のEnterpriseプランでは、Fable 5は7月7日まで週間使用制限の50%まで無料で含まれます。その後は使用クレジットに移行します。Anthropicはまた、AWS、Google Cloud、Microsoft FoundryでもFable 5を再び利用可能にしています。開発者はモデルを文字列"claude-fable-5"で呼び出します。分類器が作動すると、応答はOpus 4.8から返されますが、コードパスは変わりません。

要点まとめ

  • Fable 5は輸出規制解除後、7月1日に復帰。
  • 新しい分類器が報告されたバイパスを99%以上のケースでブロック。
  • ブロックされたリクエストはOpus 4.8にルーティングされ、直接拒否されない。
  • Anthropicはジェイルブレイク評価のための4基準フレームワークを提案。
  • 停止期間中、GLM-5.2がより安価なオープンウェイトの競合として登場。