2026-07-02 12:03 UTC+9サイト内リライト2 分で読了更新: 2026-07-02 12:32 UTC+9

Fable復活：このセーフガードにはAIが組み込まれている

Anthropicは輸出制限を経てFable 5を再展開したが、新バージョンではより厳格な安全分類器が導入され、特にコーディングタスクにおいて多くの良性リクエストがブロックされる。米国政府はモデルの事前アクセスと専用計算リソースを獲得し、AI業界の国家管理への移行を示している。

ソースHacker News AI著者: swolpers

Anthropicは2026年7月1日、同社の最先端モデルFable 5を再展開した。以前、このモデルはAmazonの研究者によって発見されたジェイルブレイク手法により、米国政府から輸出制限を受けていた。現在、Fable 5はより厳格な安全対策とともに戻ってきたが、ユーザーは特にプログラミングなどのタスクにおいて、より多くの制限に直面することになる。

Anthropicのブログ投稿によると、新しい安全分類器は政府との協力を経て改良され、特定のジェイルブレイク行動を防ぐように設計されている。しかし、この改良は誤検知の増加を伴う。Anthropicは、日常的なコーディングやデバッグのタスクにおいて、より多くの良性リクエストが危険とみなされ、能力の低いOpus 4.8モデルに転送されることを認めている。同社はこれを「安全マージン」の拡大と表現し、リクエストが分類器をトリガーしないためには「非常に明らかに安全」である必要があると述べている。

この変更は懸念を引き起こしている。Fable 5は当初から過敏性が批判されていたが、新バージョンはさらに問題を悪化させているようだ。最先端モデルを複雑な実験に依存するユーザーにとって、この制限は実質的な能力を低いレベルのモデルに留めてしまう可能性がある。Anthropicは誤検知を減らすために分類器の改善を続けると約束しているが、筆者は現在の規制枠組みの下では、完全にオープンなモデルが再び現れることはないだろうと指摘する。

今回の再展開には政府の役割の明確な強化も伴う。Anthropicは米国商務省、国家サイバー局長室など複数の政府機関と緊密に協力し、将来のモデルに対して事前リリースの政府アクセスと評価を提供することを約束した。さらに、Anthropicは共同研究のための専用チームと計算リソースを設置する。ハワード・ラトニック商務長官の書簡によれば、これらの合意は将来の全てのモデルに適用され、政府は状況の変化に応じて制限を再評価する権利を留保する。

筆者のアルベルト・ロメロは、この出来事は一見再現可能なジェイルブレイクの脆弱性への対応のように見えるが、実際には政府がAI業界を完全に掌握するための道を開くものだと論じている。彼は「これはAIが最も悪くなる瞬間であり、AIが最も自由になる瞬間でもある」と述べた。将来、より強力なモデル能力はより厳格な安全対策とユーザーの自律性の低下を意味し、政府とAI企業の結びつきはますます強固になるだろう。

具体的には、Fable 5の新バージョンではユーザーが週間クォータの50%しかこのモデルにアクセスできず、以前の100%から減少した。Anthropicはこれを安全上の理由と説明するが、筆者は実際には計算リソース不足が原因だと推測する。さらに、安全分類器がコーディングタスクでの誤検知を増やし、多くの正当なリクエストを拒否している。筆者は、もし最先端モデルの能力が低いレベルに制限されるなら、AI能力のフロンティアは実質的にOpus 4.8やGPT-5.5レベルに留まると懸念する。

政府側では、米国商務省が将来のすべてのモデルリリースを精査し、状況変化に応じてライセンス要件を再課す権利を明示した。この合意はFableだけでなく、Anthropicの将来の全モデルに適用される。筆者は、これが米国政府によるAI業界統制の始まりであり、ユーザーの自由なAI利用の終焉を意味すると警告する。彼は、モデル能力が向上するにつれて安全制限が強化され、ユーザーはAIに対する自律性を失うだろうと予測している。