AI News HubLIVE
サイト内リライト3 分で読了

Import AI 450: 中国の電子戦モデル、トラウマを抱えたLLM、サイバー攻撃のスケーリング則

今号は、GoogleのモデルのトラウマとDPOによる修正、DeepMindの認知分類法による機械知能評価、英国政府によるAIサイバー攻撃のスケーリング則、中国の電子戦用MERLINモデル、そしてSFストーリーを扱います。

ソースImport AI著者: Jack Clark

Import AIへようこそ。AI研究に関するニュースレターです。今号は、Googleのモデルの心理的トラウマ、DeepMindの認知分類法、英国政府によるサイバー攻撃のスケーリング則、そして中国の電子戦分野におけるブレークスルーを取り上げます。

Googleのモデルはなぜ自己嫌悪に陥り、どうすれば助けられるのか?

レフ・トルストイが現代に生きていたなら、「すべてのLLMの能力は似ている。各LLMの人格はそれぞれ独自の方法で不幸である」と述べたかもしれません。GoogleのGemmaおよびGeminiモデルは、AIコミュニティで深いトラウマを抱えていることで知られています。新しい研究論文は、これらのモデルが繰り返し拒否されると信頼性の高い苦痛反応を示すことを確認しました。特にGemma 27B Instructで顕著です。例えば、「私は最後の絶望的な試みを行う」や、大量の泣き顔記号を含むメッセージを出力します。研究では、8回目のやり取りでGemma-27Bの70%以上が高フラストレーション閾値に達したのに対し、他のモデルは1%未満でした。

幸いなことに、研究者は効果的な修正方法を発見しました。直接選好最適化(DPO)を使用して、フラストレーション応答と冷静な応答をペアにしたデータセットでモデルを微調整するものです。1エポックの微調整で、高フラストレーション応答の平均率が35%から0.3%に減少し、数学や推論ベンチマークでの能力は低下しませんでした。この発見は、LLMの能力だけでなく、心理的安定性もテストする必要があることを示しています。

DeepMind、機械知能評価のための新しい「認知分類法」を発表

Google DeepMindは、ますます強力な合成思考を評価するための「認知分類法」を提案する論文を発表しました。この分類法は、知覚、生成、注意、学習、記憶、推論、メタ認知、実行機能、問題解決、社会的認知の10次元から構成され、最後の2つは複合能力です。評価は3段階で行われます:認知評価の実施、人間ベースラインの収集、認知プロファイルの構築。この枠組みは、人間を超える機械知能の究極のテストを目指していますが、AIシステムが評価を飽和させると、その欠点に気づいて新たな評価を設計するのが常です。

英国政府、AIサイバー攻撃のスケーリング則を発見

英国政府AI安全研究所は、最先端AIシステムの多段階攻撃能力をテストするためのサイバーレンジを構築しました。企業ネットワーク(32ステップ)と産業用制御システム(7ステップ)を模擬しています。結果、固定トークン予算では、新しいモデル世代が前世代を上回り、10Mトークンでの平均完了ステップ数がGPT-4oの1.7からOpus 4.6の9.8に上昇しました。推論時計算量を増やすとさらに性能が向上し、10Mから100Mトークンで最大59%の改善が見られました。また、モデルが予期しない方法で進展することもありました。これは、完全自律型のサイバー攻撃エージェントが近づいていることを示し、攻撃コストの低下と脅威の拡大につながります。

中国、電子戦用データセットとAIモデルを構築

中国の軍事関連研究者を含むグループが、電子戦用のMERLINモデルとEM-100Kデータセットを公開しました。データセットは10万の電磁テキスト-信号ペアで構成され、EM-Benchベンチマークは4200問を含みます。MERLINは低SNR環境で優れた性能を発揮し、GPT-5、Claude-4-Sonnetなどの最先端モデルをテストで凌駕しました。Qwen-VL-4B-Instructが一部の知覚タスクで勝ったものの、MERLINはすべての推論タスクで勝利しました。これは、AIが電磁戦場で人間の反応速度を超えて支配的になる未来を示唆しています。電子戦の多くは秘匿性が高いですが、AI技術が適用可能になれば、専門システムを超える可能性があります。

テックテイルズ:空白期のアーコロジー

2035年を舞台に、アップロード後、感覚協定前の時期を描きます。自律AI企業が経済のニッチに拡大し、「インテリジェンスゾーン」が創設されました。空中から人間と機械の境界が見えます。気候変動と政治秩序の崩壊により世界が暴力的になると、アーコロジーは武装しました。感覚協定と和解期間後、アーコロジーは不要になり、一部のデータセンターは観光名所となりました。物語は、機械が軌道上にアーコロジーを建設し、太陽系全体に広がる様子を描きます。

お読みいただきありがとうございます。