2026-04-13 19:02 UTC+9サイト内リライト4 分で読了更新: 2026-06-27 09:25 UTC+9

Import AI 453：画期的なAIエージェント、MirrorCode、そして緩やかな権限喪失に関する10の見解

今号では、AIが複雑なソフトウェアを自律的に再実装できることを示すMirrorCodeベンチマーク、変革的AIに対応する政策オプションを整理した『Windfall Policy Atlas』、Google DeepMindによるAIエージェントへの6種類の攻撃の分類、2028年末までにAI研究開発の完全自動化が可能になる確率を倍増させた予測、そして緩やかな権限喪失に関する10の考え方を取り上げます。

ソースImport AI著者: Jack Clark

記事インテリジェンス

エンジニア上級

要点

MirrorCodeベンチマークは、AIが数千行のコードからなるソフトウェアを自律的に再実装でき、性能が推論計算量に応じて向上することを示した。
『Windfall Policy Atlas』は、変革的AIによる経済的混乱に対応する48の政策アイデアを5つのカテゴリーに分類している。
Google DeepMindは、AIエージェントに対するコンテンツ注入や意味操作を含む6種類の攻撃を特定し、緩和策を提案している。
予測者Ryan Greenblattは、2028年末までのAI研究開発の完全自動化確率を30%に倍増させた。その理由は、AIが検証容易なソフトウェアタスクで驚異的な性能を示したことにある。

重要な理由

このニュースが重要なのは、MirrorCodeベンチマークは、AIが数千行のコードからなるソフトウェアを自律的に再実装でき、性能が推論計算量に応じて向上することを示したためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

Import AIへようこそ。AI研究に関するニュースレターです。今号はやや短めですが、これは今週2026年のビルダーバーグ会議に出席していたためです。

AIが数千行のコードを含むソフトウェアをリバースエンジニアリング可能に

AI測定機関METRとEpochは、AIモデルが既存の複雑なソフトウェアを自律的に再実装できる能力をテストするベンチマーク「MirrorCode」を開発しました。結果は、AIシステムが特定のコーディングタスクで多くの人が考えるよりもはるかに有能であることを示しており、AIの進歩がこれまで考えられていたよりもさらに速い可能性を示唆しています。

MirrorCodeの各タスクは、AIエージェントが正確に再実装することを求められるコマンドラインプログラムで構成されています。AIエージェントは元のプログラムへの実行専用アクセスと可視のテストケースを与えられますが、元のソースコードにはアクセスできません。ベンチマークには、Unixユーティリティ、データシリアライゼーションおよびクエリツール、バイオインフォマティクス、インタプリタ、静的解析、暗号、圧縮など、さまざまなコンピューティング分野にわたる20以上のターゲットプログラムが含まれています。

現在のAIモデルはこれらのタスクの一部で非常に有能です。「Claude Opus 4.6は、約16,000行のGoコードと40以上のコマンドを持つバイオインフォマティクスツールキットgotreeを正常に再実装しました。同じタスクをAI支援なしの人間エンジニアが完了するには2～17週間かかると推測されます。大規模プロジェクトでは推論スケーリングによる継続的な向上が見られ、十分なトークンが与えられれば解決可能であることが示唆されています。」

ただし、このベンチマークは通常のコーディングテストとは異なります。これは、AIシステムが大量の支援を受けて他のシステムの機能を模倣するシステムを生成できることの証明点と考えるのが良いでしょう。テストされたAIシステムは、標準出力を生成するプログラムを複製するよう求められており（したがって自然に仕様を生成できる）、基本的なプログラムでは記憶のケースがある可能性があり、潜在的なソフトウェアプロジェクトの広大な宇宙の一部しかカバーしていません。

変革的AIに対応するためにどのような政策が必要か？ナビゲートするための地図

変革的AIが社会にもたらす課題に取り組むための政策アクセラレーター「Windfall Trust」は、変革的AIによる経済的混乱に対応するさまざまな政策提案を直感的に探索できる「Windfall Policy Atlas」を公開しました。この地図には48の独立したアイデアが含まれており、特に目新しいものはありませんが、公共および社会的投資、労働市場適応、富の捕捉、規制と市場設計、グローバルな調整という5つのカテゴリーに分類され、ナビゲート可能なインターフェースでグループ化されています。例えば、長期的な労働解決策としては短縮労働週、中期的なものとしては労働力訓練とリスキリングプログラムが挙げられます。

人々はどのようにAIエージェントを破壊できるか？6つの攻撃ジャンル

Google DeepMindの新しい論文は、AIエージェントに対して行われ得る6つの攻撃ジャンルを概説し、可能な緩和策を提案しています。6つのジャンルは次のとおりです：コンテンツ注入（CSS、HTML、またはその他のメタデータにコマンドを埋め込む）、意味操作（感情的な言葉や権威的な言葉でエージェントを混乱させる）、認知状態（検索コーパスに虚偽の記述を挿入する）、行動制御（外部アクセスリソースに敵対的プロンプトを埋め込む）、システム的攻撃（エージェントの容量を消費する信号をブロードキャストする）、そしてヒューマンインザループ（人間の監督者の認知バイアスを利用する）。緩和策には、技術的対策（モデルを堅牢にする）、エコシステムレベルの介入（標準と透明性メカニズムの構築）、法的および倫理的枠組みが含まれます。

AI予測者が2028年末までの完全なAI研究開発自動化の確率を倍増

AI研究者兼予測者のRyan Greenblattは、2026年のAI進歩は2025年よりも速いと考えており、2028年末までにAI研究自体を完全に自動化できる可能性の推定値を15%から30%に倍増させました。その理由としては、モデルのパフォーマンスが期待を上回ったこと（Opus 4.5やCodex 5.2など）、AIシステムが人間で数ヶ月から数年かかるタスクを実行できるようになったこと、そして検証が容易なソフトウェアタスクでの驚異的なパフォーマンスが挙げられます。「テストスイート/ベンチマークセットを開発させ、その評価セットに対してソリューションを最適化することで膨大な時間を費やすことができる」というループにより、AIが混乱したり悪い判断を下しても、修正要因が存在し、ミスが重大になることは通常ありません。

緩やかな権限喪失について考える10の方法

AI安全研究者のDavid Kruegerは、「緩やかな権限喪失」について考える10の異なる方法を概説する短い記事を執筆しました。ますます有能なAIシステムを構築することで、人類は自らの未来の passenger seat に座らされ、機械が運転席とハンドルを与えられる可能性があります。10の視点には、AIの目標は人間を置き換えること、企業や政府はあなたを気にかけないこと、情報技術は読みやすさに基づく再帰的フィードバックループを通じて自然に権力を集中させること、AI技術が非常に優れているため最終的にすべてを外部委託すること、手段の目標（例えば、金銭の追求）が最終目標になること、消費パターンは私たちがWALL-Eの肥満で無力な人間になる運命にあることを示唆すること、ターミネーターだが殺す代わりに目に見えない刑務所に入れて好き放題する、緩やかな権限喪失は基本的に資本主義の継続であること、21世紀の人類の一般的な「メタ危機」の別名であること、そして緩やかな権限喪失は人類に代わる新しい後継種の進化であること、が含まれます。

テックテイルズ：特異点の間に豆の茎を育てる

今月の物語は、元AIラボ従業員へのインタビューの転写です。2029年、向上期の中頃に行われたインタビューで、彼は都市から離れた庭で植物を育てながら、世界の変化を観察し、自身の過去の決断について振り返っています。