2026-04-10 06:28 UTC+9サイト内リライト2 分で読了更新: 2026-06-27 09:25 UTC+9

Claude Mythosと誤ったオープンウェイトモデルへの恐怖

本記事は、Claude Mythosモデルの発表後に生じたオープンウェイトAIモデルに対する恐怖の波を分析する。著者は、過去の誇張された恐怖と同様であると主張し、全面禁止ではなく詳細な研究を求める。

ソースInterconnects (Nathan Lambert)著者: Nathan Lambert

記事インテリジェンス

エンジニア上級

要点

Claude Mythosがオープンウェイトモデルによるサイバー攻撃の懸念を引き起こした。
GPT-2やGPT-4の際にも同様のパニックがあったが、現実化しなかった。
そのようなモデルを実行するコストとリソースは、攻撃者の数を制限する。
著者は、サイバーセキュリティ能力の具体的評価と的を絞った監視を提唱する。

重要な理由

このニュースが重要なのは、Claude Mythosがオープンウェイトモデルによるサイバー攻撃の懸念を引き起こしたためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

Claude Mythosモデルの発表と、その強力な能力（特にサイバーセキュリティ分野）により、オープンウェイトAIモデルに反対する新たな波が生じました。批判派は、デジタルインフラがオープンウェイト版に備えられておらず、多数の関係者による攻撃を許すと主張します。しかし著者は、この反発が多くの未知要素を単純な政策提言にまとめ、かえってサイバーセキュリティの準備を弱める可能性があると指摘します。

過去を振り返れば、OpenAIがGPT-2の重みを非公開にした2019年や、GPT-4を公開した2023年にも同様のパニックが起きましたが、いずれも現実化しませんでした。現在の議論の根本的誤りは、オープンとクローズドモデルの能力差が静的であると仮定し、オープンウェイト一般を特定の問題に結びつけることです。著者は以前、最良のオープンウェイトモデルは近い将来、全体的な能力でクローズドモデルに遅れをとるが、6～18か月のタイムラグは安全性と監視のバランスとして有益だと論じています。

サイバーセキュリティに特化すれば状況はより複雑です。オープンモデルは特定のベンチマークで迅速に追従しますが、クローズドモデルは汎用エージェント能力で優位です。Claude Mythosレベルのオープンモデルのリスク評価には、訓練と重みの公開、モデルに効果的なツールを与えるハーネス、推論計算とソフトウェアの3要素が必要です。現在の推定では、主要なクローズドモデルは約3～5兆パラメータ、最大のオープンモデル（中国の研究所）は約1兆パラメータです。Claude Mythosの価格はOpusの5倍で、パラメータの倍増と推論効率の低下が要因と考えられます。

このようなモデルの実行コストは高額で、8兆パラメータのMoEモデルには約100基のH100 GPU（1日約1万ドル）が必要です。そのため、これらのリソースにアクセスできる主体は限られ、インターネット上のすべての10代に核兵器を渡すようなものではありません。著者は、サイバーセキュリティの悪用がオープンモデルの公開をグレーゾーンにする可能性を認めつつも、過去の経験から現時点では全面禁止の理由にはならないと述べます。

最後に著者は、オープン・クローズドモデルのサイバーセキュリティ能力の測定、Claude MythosとProject Glasswingの実際の影響評価、必要に応じた特定能力の監視・規制という3つの研究課題を提案します。目的は、オープンモデルへの恐怖を具体的に保つことです。全面禁止は、その国からこの重要技術に影響を与える力を奪い、別の国が中心となることを許すだけです。