Import AI 448:AI研究開発;ByteDanceのCUDA記述エージェント;衛星オンデバイスAI
本号では、予測を上回るAI進歩の加速、AI研究開発自動化のための14の指標、バンガロールでのエッジコンピューティング交通監視、小型衛星搭載AIモデル、ByteDanceのCUDA生成エージェント、ドローン戦争を描くSF小説を取り上げる。
最新のImport AIでは、AI分野の重要な進展を概観する。まず、長年AI予測に携わるAjeya Cotra氏はブログで、2026年に関する自身の予測がすでに楽観的すぎたと認めた。METRの最近のテスト結果によれば、Opus 4.6のタイムホライズンは12時間であり、彼女が1月に予測した2026年末の約24時間を大幅に下回っている。彼女は、今年末までにAIエージェントのタイムホライズンが100時間を超えると推測し、「タイムホライズン」という概念自体が崩壊し始めると述べている。これは、AIシステムが驚異的なペースで能力を向上させており、「ソフトウェア爆発」の可能性を示唆している。
これに対処するため、GovAIとオックスフォード大学の研究者は、AI研究開発自動化(AIRDA)を測定する14の指標を提案した。これらの指標は、AIの性能、人間との協調、アラインメント、計算リソース配分など多岐にわたる。具体的には、AI研究開発におけるAIのパフォーマンス、人間および人間-AIチームとの相対比較、監視レッドチーミング、AIRDAにおけるミスアラインメント、効率改善率、従業員調査、高リスク意思決定でのAI使用頻度、研究者の時間配分、企業の監督効果、AIシステムによる開発者目標の妨害、研究者数と業績、計算資源の分布、研究開発費に占める計算コストの割合、AIシステムの権限とその変化などが含まれる。これらの指標は、再帰的自己改善の前兆を捉え、ガバナンスの基盤を提供する。
応用面では、インド科学研究所が開発したAIITSシステムが、YOLOやSAM3を用いてバンガロールの路上カメラ映像をエッジデバイスでリアルタイム処理する。100台のカメラをシミュレートしたプロトタイプが成功し、著者らは1000ストリームへの拡大を計画している。このシステムは、ネットワーク周辺でビデオ分析をローカライズすることで、中央集権的な帯域幅のボトルネックを回避し、持続可能な都市規模の交通センシングを実現する。
また、ドイツ人工知能研究センターは、FPGA上で低消費電力動作するTinyIceNetを開発した。このモデルは合成開口レーダーデータから海氷の厚さを推定するもので、AMD Xilinx ZCU102ボード上で7フレーム/秒、1シーンあたり113.6ミリジュールの低エネルギーで動作する。RTX 4090は高速だが消費電力が大きく、衛星には不向きである。この研究は、エッジコンピューティング向けの超軽量ビジョンモデルの実現可能性を示している。
ByteDanceと清華大学の共同研究であるCUDA Agentは、Seed 1.6モデルを微調整し、GPUカーネル生成において最先端の性能を達成した。エージェントはOpenHandsフレームワーク上で動作し、PyTorchコードの分析、カスタムCUDA演算子の実装、コンパイルと評価を反復し、5%以上の高速化を達成する。KernelBenchのLevel-1およびLevel-2で100%、Level-3で92%の成功率を記録し、Claude Opus 4.5やGemini 3 Proを約40%上回った。これは、AIが自らの基盤インフラを最適化する自己強化サイクルの始まりを示す。
最後に、物語「Dandelion Sky」は2031年の北欧を舞台に、5年間続くドローン戦争に守られた都市を描く。すべての機械が突然停止した朝、主人公は家族を守ろうとするが、誰も原因を知らない。ドローンの意思決定はAIによる分散システムに委ねられており、人間は制御不能に陥る。この物語は、ウクライナのドローン戦争、自動化とAIの漸進的な権力剥奪、そして危機における家族の絆をテーマにしている。