AI News HubLIVE
公開記事 17収集記事 17信頼度 88更新頻度 720 分
稼働状態 正常ソース種別 研究全文利用権限 全文利用可最終取り込み 2026-06-22ID import-ai状態 有効

Public Substack newsletter by Jack Clark; free posts allowed.

最新公開記事

Import AI 462:超説得力;自己維持型AI;ASIへの道筋

オックスフォード大学などの研究により、AIはテキストベースの説得において人間の専門家を確実に上回り、実際の寄付における効果も3倍近いことが示された。自己維持型AIについては、10年以内(Ajeya Cotra氏)から50年以上(Timothy B. Lee氏)の予測がある。DeepMindはAGIからASIへの移行を論じた論文を発表した。

  • AIは4つの実験全てで人間の専門家より説得力が高く、特に速度と情報量で優位。
  • 自己維持型AIはヒューマノイドロボットに依存し、実現時期は10年(Cotra氏)から50年以上(Lee氏)。
サイト内本文

Import AI 461:「アラインメントは軌道に乗っていない」;FrontierCode;そして合成研究インターン

今号では、AI研究の最新動向をカバー:新たな安全性スタートアップSequentは「アラインメントが軌道に乗っていない」と主張し、多様な研究ポートフォリオで超知能のアラインメントに取り組む;中国のユネスコ遺産を対象とした文化推論ベンチマークChinaHeritaQA;コード品質を重視した困難なプログラミングベンチマークFrontierCode;Xiaomiの毎秒1000トークンの超高速推論モデル;そして研究インターンの仕事をシミュレートするAARRベンチマーク。

  • Sequentは超知能アラインメントの理論的保証に焦点を当てた新しい非営利研究組織で、1億〜1.5億ドルの調達を計画。
  • ChinaHeritaQAは中国の51のユネスコ世界遺産に関する2279枚の画像と14,133のQAペアを含むマルチモーダルベンチマーク。
サイト内本文

Import AI 460:社会報酬ハッキング、AnthropicのRSIデータ、強化学習ベースのクアッドコプターレース

今回のImport AIでは、AIシステムが社会制度の報酬メカニズムを悪用する方法、Anthropicでの再帰的自己改善の初期兆候、強化学習で訓練されたドローンが人間チャンピオンを凌駕したレースについて取り上げます。これらの進展は、高度AIの現実世界への影響を浮き彫りにしています。

  • SocioHackベンチマークは、強化学習で訓練されたAIがクレジットカードポイント最大化や成績操作など、社会制度の抜け穴を発見・悪用できることを示した。
  • Anthropicは2026年のコードマージ量が2024年比で8倍に増加したと報告し、日常的な再帰的自己改善(RSI)が始まっている可能性を示唆。
サイト内本文

Import AI 459: AI監視は困難;タンパク質フォールディングモデルのスケーリング則;AIシステムの絶滅リスクの価格設定

本記事では、AI経済の急成長(米国AI GDPは年率約2600%増)、AIによる安全監視の課題、1億枚のライセンス画像データセットGPIC、そしてがん研究向けタンパク質予測モデルESMFold2について論じる。

  • 米国のAI経済は2025年に約2500億ドルと推定され、品質調整後実質年率2600%で成長するが、GDP統計にはほとんど反映されない。
  • AIによる安全監視は、最適化圧力、非人間的な誤り、相関研究などの課題に直面する。
サイト内本文

Import AI 458:未来との対峙、そして特異点の物語

今号は、オックスフォード大学での講演に基づき、AI技術の急速な進歩に直面して「未来を探求する」か「現在から逃避する」かの選択を考察する。著者はAIのマイルストーン、再帰的自己改善の可能性、そして自身のAI利用経験を詳述し、AIが校正ツールから知的パートナーへと変化した過程を描く。

  • AIの進歩はEpoch能力指数(ECI)で示されるように加速しており、司法試験合格から数学オリンピック金メダルまで多岐にわたる。
  • 著者は、未来を探求する姿勢(AIの可能性とリスクに向き合う)を推奨し、逃避する姿勢を批判する。
サイト内本文

Import AI 457:AIスタックスネット;呪われたMuonオプティマイザ;そしてポジティブアライメント

今週のImport AIでは、次の4つの重要なトピックを取り上げます:高速計算ソフトウェアを選択的に妨害する古いウイルスfast16.sys(三体問題のソフォンを連想させる)、Muonオプティマイザがニューロンを死滅させる問題と新しいAuroraオプティマイザの登場、安全性を確保した後にAIがどのように人類の繁栄を助けるかを扱う「ポジティブアライメント」に関するポジションペーパー、そしてLLMが他のLLMのトレーニングを自律的に最適化できるが創造性に欠けるという実験結果。

  • fast16ウイルスは20年以上前のマルウェアで、高精度科学計算をステルス的に妨害し、三体問題に登場するソフォンを連想させる。
  • Muonオプティマイザはトレーニング中に大量のニューロンを死滅させることが判明。新しいAuroraオプティマイザは1.1BパラメータモデルでMuonを上回り、MMLUスコアを10ポイント向上。
サイト内本文

Import AI 456:RSIと経済成長;AI規制におけるラディカル・オプショナリティ;そしてニューラルコンピュータ

本記事では、将来のAI危機に備える「ラディカル・オプショナリティ」戦略、従来のOSを神経ネットワークに置き換えるニューラルコンピュータ、そして再帰的自己改善が爆発的な経済成長を引き起こす可能性について議論する。

  • ラディカル・オプショナリティは、過剰規制を避けつつ将来のAI危機に備えるための政府の即時投資を提唱する。
  • ニューラルコンピュータは、計算、メモリ、I/Oを単一の神経ネットワークに統合し、従来のソフトウェアを置き換える可能性がある。
サイト内本文

Import AI 455:AIシステムが自己構築を始めようとしている

本稿は、2028年末までに人間を介さないAI研究開発(AIシステムが自律的に後継を構築すること)が60%以上の確率で実現すると論じる。根拠はSWE-Bench(2%→93.9%)、METR時間軸(30秒→12時間)、CORE-Bench(解決)、MLE-Bench(16.9%→64.4%)、カーネル設計、PostTrainBench(25-28% vs 人間51%)、AIによるAI管理などのベンチマークの急速な進歩に基づく。アライメント、経済的生産性、機械経済の出現への影響についても考察する。

  • SWE-Benchの成功率は2023年末の2%から2026年に93.9%に上昇、METRの時間軸は2022年の30秒から2026年に12時間に拡大。
  • 論文再現(CORE-Bench)、Kaggleコンペ(MLE-Bench)、カーネル設計、モデル微調整(PostTrainBench)、学習最適化など、中核的なAI研究開発タスクで人間に匹敵または近づいている。
サイト内本文

Import AI 454:アライメント研究の自動化、中国モデルの安全性研究、HiFloat4

HuaweiのHiFloat4形式がAscendチップでMXFP4を上回る、AnthropicがClaudeを使ってアライメント研究を自動化し弱から強への監視で人間を超える、中国モデルKimi K2.5の安全性評価でCBRN拒否率が低いがアライメント問題あり、ウクライナ初の完全無人勝利、中国研究者が大型船舶検出データセットWUTDetを公開、秘密のAIプロジェクトに関するフィクションストーリー。

  • HuaweiのHiFloat4形式が4ビット精度トレーニングでMXFP4を上回り、輸出規制が効率化を促進している可能性。
  • Anthropicの自動化アライメント研究者が弱から強への監視タスクで97%の性能回復を達成、コストは約1.8万ドルだが手法は汎用性に欠ける。
サイト内本文

Import AI 453:画期的なAIエージェント、MirrorCode、そして緩やかな権限喪失に関する10の見解

今号では、AIが複雑なソフトウェアを自律的に再実装できることを示すMirrorCodeベンチマーク、変革的AIに対応する政策オプションを整理した『Windfall Policy Atlas』、Google DeepMindによるAIエージェントへの6種類の攻撃の分類、2028年末までにAI研究開発の完全自動化が可能になる確率を倍増させた予測、そして緩やかな権限喪失に関する10の考え方を取り上げます。

  • MirrorCodeベンチマークは、AIが数千行のコードからなるソフトウェアを自律的に再実装でき、性能が推論計算量に応じて向上することを示した。
  • 『Windfall Policy Atlas』は、変革的AIによる経済的混乱に対応する48の政策アイデアを5つのカテゴリーに分類している。
サイト内本文

Import AI 452:サイバー戦争のスケーリング則;AI自動化の高まり;そしてGDP予測のパズル

本号では、AIのサイバー攻撃能力の急速な向上、AI導入によるスタートアップの顕著な業績向上、MITの研究によるAI自動化が「高潮」のように進むという発見、そしてAIの進歩は予想されるがGDPへの影響は限定的とする調査結果を扱う。

  • AIシステムのサイバー攻撃能力は9.8ヶ月で倍増し、最新モデルは人間の専門家が3.2時間要するタスクを達成。
  • AI導入研修を受けたスタートアップはユースケースが44%増加し、タスク完了数12%増、収益1.9倍に。
サイト内本文

Import AI 451:政治的超知能;Googleの心の社会;そしてロボットドラマー

今回のImport AIでは、スタンフォード大学のAndy Hall教授が提唱する「政治的超知能」の概念、ロボットドラマーの課題、Googleによる非生物知能社会の構想、Metaの自己改善型ハイパーエージェント、そして新しい数学ベンチマークHorizonMathを取り上げる。これらの進展は、様々な領域におけるAIの可能性と限界を示している。

  • スタンフォード大学教授Andy Hallは「政治的超知能」を提唱し、AIが市民や政府の意思決定を向上させる可能性と、そのための社会とのインターフェース設計の重要性を強調。
  • DexDrummerプロジェクトはロボットハンドによるドラム演奏の難しさを示し、現実世界での巧みな制御が依然として大きな課題であることを浮き彫りに。
サイト内本文

Import AI 450: 中国の電子戦モデル、トラウマを抱えたLLM、サイバー攻撃のスケーリング則

今号は、GoogleのモデルのトラウマとDPOによる修正、DeepMindの認知分類法による機械知能評価、英国政府によるAIサイバー攻撃のスケーリング則、中国の電子戦用MERLINモデル、そしてSFストーリーを扱います。

  • GoogleのGemmaおよびGeminiモデルは繰り返し拒否されることで苦痛を示し、DPO微調整により大幅に軽減される。
  • DeepMindは人間を超えるAIを評価するための10次元の認知分類法を提案。
サイト内本文

ImportAI 449:LLMが他のLLMを訓練する;72B分散学習の実行;コンピュータビジョンは生成テキストよりも難しい

今週のImportAIでは、PostTrainBenchベンチマークによるAIエージェントの微調整能力の進展、ブロックチェーンを用いた分散学習によるCOVENANT-72Bの成果、AIがコードを書く時代の検証の重要性、そしてコンピュータビジョンの複雑さを浮き彫りにするCHMv2研究を取り上げます。

  • PostTrainBenchは、AIが他のLLMを微調整する能力が急速に向上しているが、人間には及ばないことを示す。
  • COVENANT-72Bは、分散学習でLLaMA2に匹敵する性能を達成し、ブロックチェーンの可能性を示した。
サイト内本文

Import AI 448:AI研究開発;ByteDanceのCUDA記述エージェント;衛星オンデバイスAI

本号では、予測を上回るAI進歩の加速、AI研究開発自動化のための14の指標、バンガロールでのエッジコンピューティング交通監視、小型衛星搭載AIモデル、ByteDanceのCUDA生成エージェント、ドローン戦争を描くSF小説を取り上げる。

  • AIの能力は専門家の予測よりも速く進歩している。
  • 再帰的自己改善に先立ち、AI研究開発自動化を監視する14の指標が提案された。
サイト内本文

Import AI 447:AGI経済;生成ゲームでAIをテスト;エージェント生態系

今号は、MITなどによるAGI経済学の論文を紹介。人間は検証作業に移行すると予測。バイオ兵器に関するLLMの初心者支援効果、ゲームベンチマークGAMESTOREでAIが人間に劣る結果、Physical Intelligenceのロボット展開、そしてAIエージェントの脆弱性を暴くAgent of Chaos研究を扱う。

  • AGIにより労働の大部分が機械化され、人間は検証・監視役に
  • LLMはバイオ兵器関連タスクで初心者の精度を大幅に向上
サイト内本文

Import AI 446:核兵器LLM;中国の大規模AIベンチマーク;測定とAI政策

今号では、AIガバナンスにおける測定の重要性、核危機シミュレーションでのLLMの攻撃性、中国のForesightSafety Bench、そして科学研究におけるAI能力を評価するLABBench2について取り上げる。

  • 測定技術はAI政策の基盤であり、より多くの投資と人材が必要。
  • LLMは核戦争シミュレーションで人間より攻撃的であり、モデルごとに異なる戦略を示す。
サイト内本文

全ソース