Import AI 457:AIスタックスネット;呪われたMuonオプティマイザ;そしてポジティブアライメント
今週のImport AIでは、次の4つの重要なトピックを取り上げます:高速計算ソフトウェアを選択的に妨害する古いウイルスfast16.sys(三体問題のソフォンを連想させる)、Muonオプティマイザがニューロンを死滅させる問題と新しいAuroraオプティマイザの登場、安全性を確保した後にAIがどのように人類の繁栄を助けるかを扱う「ポジティブアライメント」に関するポジションペーパー、そしてLLMが他のLLMのトレーニングを自律的に最適化できるが創造性に欠けるという実験結果。
今回のImport AIでは、AIセキュリティ、最適化手法、そして将来の方向性に関する4つの重要なトピックを取り上げます。
まず、約20年前のウイルス「fast16.sys」について。SentinelOneの研究者により発見されたこのマルウェアは、高精度計算ソフトウェアを選択的に妨害するように設計されています。メモリ内のコードにパッチを当てて計算結果を改ざんし、自己伝播機構と組み合わせることで、施設全体に同等の誤った計算を引き起こします。この攻撃は、SF小説『三体』に登場するソフォン(地球の物理学実験を妨害する技術)を連想させます。調査の結果、このウイルスはLS-DYNA 970、PKPM、MOHIDなどのエンジニアリングおよびシミュレーションソフトウェアを標的としており、これらのソフトウェアは衝突試験、構造解析、環境モデリングに使用されています。特にLS-DYNAは、イランの核兵器開発に関連するコンピュータモデリングの報告で言及されています。このウイルスは、小さな誤差を導入することで科学プログラムを遅らせたり、壊滅的な損害を引き起こす可能性があります。これは、超知能が「AI不拡散」を核不拡散と同様に重要視する可能性を示唆しています。
2つ目のトピックは、Muonオプティマイザの問題です。Tilde Researchの研究者は、Muonオプティマイザにニューロンを永久に死滅させる欠陥があることを発見しました。Muonの更新は行ノルムの異方性を継承し、トレーニング初期に大量のニューロンが死に、回復しません。500ステップ後には4分の1以上のニューロンが死に、二峰性分布を生じます。これに対応して、研究者は長方形行列向けのAuroraオプティマイザを開発しました。1.1BパラメータのTransformerモデルを約100Bトークンでトレーニングした結果、AuroraはMuonやNorMuonよりも低い損失を達成し、MMLUスコアを10ポイント向上させました。Pleiasの研究者Alexander Doriaは、600MパラメータモデルでAuroraがMuonやAdamWより優れていることを独立に検証しています。これは、AdamWを凌ぐオプティマイザ構築が依然として困難であることを示しています。
3つ目は、オックスフォード大学、Google DeepMind、OpenAI、Anthropicなどの機関の研究者によるポジションペーパーで、「ポジティブアライメント」の概念を提唱しています。従来の「ネガティブアライメント」が障害の低減に焦点を当てるのに対し、ポジティブアライメントは、安全で協力的でありながら、人間と生態系の繁栄を積極的に支援するAIシステムの開発を目指します。論文は、安全だけに注力すると社会が凡庸な援助の局所最適に留まる可能性があると指摘します。著者らは、既存のAI安全の限界(天井のない床、選好と幸福の乖離、隠れた価値体系、拡張性の問題)を批判し、ポジティブアライメントには多様で分散化されたガバナンスが必要だと主張します。これは、技術的安全の成功後に直面する課題—AIをどのようにしてより良い人生のパートナーにするか—に取り組むものです。
最後に、Prime Intellectの研究は、現在のLLMがAI研究タスクにおいてどの程度自律的に性能を向上できるかを示しています。彼らはCodex(GPT5.5ベース)とClaude Code(Opus4.7)をnanoGPTスピードランチャレンジに使用し、最適化手法の変更のみで目標損失に達するステップ数を減らすタスクに取り組みました。両エージェントは約1万回の実行(約1.4万H200時間)を行い、毎回人間のベースラインを破りました。しかし、新しいアイデアを独自に考案することはできず、またコンポーネントを追加する傾向があり、削除や洗練はほとんど行いませんでした。これは、現在のAIはエンジニアリングの最適化には優れているが、創造性には依然として人間の介入が必要であることを示しています。