[AINews] フロンティアラボに就職する方法(プレトレーニング編)
Google I/O 前の静かな一日、Vlad Feinberg によるプレトレーニング分野での就職ノートが注目を集めました。他にも、Cursor の Composer 2.5 リリースと大規模トレーニング計画、Qwen3.7 のランキング上昇、llama.cpp の MTP サポートによるローカル推論の高速化、MoE や強化学習、エージェント評価に関する研究など、多くの重要な動きがありました。
記事インテリジェンス
要点
- Vlad Feinberg がフロンティアラボ向けの就職アドバイスを公開、カーネルレベルの最適化とエージェントワークの重要性を強調。
- Cursor が Composer 2.5 をリリースし、10倍の計算量で大規模モデルをゼロからトレーニング中であることを発表。
- llama.cpp の MTP サポートにより、ローカル推論速度が最大78%向上。
- Anthropic が SDK プラットフォーム Stainless を買収、開発者インフラを強化。
重要な理由
このニュースが重要なのは、Vlad Feinberg がフロンティアラボ向けの就職アドバイスを公開、カーネルレベルの最適化とエージェントワークの重要性を強調ためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
Google I/O 前日の静けさの中、Vlad Feinberg によるプレトレーニング分野での就職ノートが注目を集めました。Feinberg は、LLM 研究における最大のボトルネックはパフォーマンスの最適化であり、カーネルレベルでのチューニングが最も直接的なラボへの道だと述べています。彼はさらに、エージェントワーク(自動研究や AlphaEvolve)にも言及し、簡単な演習として Chinchilla のスケーリング則の導出や Jax による実装、Pallas カーネルによる MoE 層の最適化などを提案しています。
AI Twitter のまとめでは、複数の重要なアップデートが報告されました。Cursor は Composer 2.5 をリリースし、長時間タスクの持続的な処理能力と指示追従性を向上させたと発表。さらに、SpaceXAI と Colossus 2 の100万 H100 相当を活用し、10倍の計算量で新たなモデルをトレーニング中であることも明らかにしました。コミュニティはその効率性とコード品質を高く評価しています。
Alibaba の Qwen3.7 シリーズは Arena ランキングで順位を上げ、テキストとビジョンの両方でトップ20入りを果たし、中国のラボの着実な進歩を示しました。ByteDance は Lance マルチモーダルモデルを、Perplexity は小型の多言語 ColBERT モデルをオープンソース化しました。
ローカル推論では、llama.cpp の MTP(マルチトークン予測)サポートにより Qwen3.6 シリーズの推論速度が大幅に向上。A10G 上で Qwen3.6-27B が25 tok/s から45 tok/s(+78%)に向上し、ローカルとクラウドのギャップを縮めました。
エンタープライズ展開では、Hugging Face と Dell が Dell Enterprise Hub を通じて Kimi K2.6、DeepSeek V4 Pro などのモデルへのワンクリックアクセスを提供。Zyphra は AMD Instinct MI355X でのエンドツーエンド推論ベンチマークを公開し、NVIDIA B200 との差を縮めたと主張しています。
研究分野では、MoE の設計空間が主に専門家のサイズと数に依存するという知見や、Meta の AIRA によるニューラルアーキテクチャ探索の成功などが報告されました。強化学習では、報酬モデルの平滑化や「想像力での学習」が注目されています。データ混合問題も重要な研究テーマとなり、On-Policy Mix などの手法が提案されています。
エコシステムでは、Anthropic が SDK プラットフォーム Stainless を買収し、開発者エクスペリエンスの垂直統合を進めています。また、Anthropic と OpenAI がトップ AI スタートアップの収益に占める割合が増加しており、経済的な集中が進んでいる可能性があります。Papers With Code は AI エージェントによる自動解析で復活しつつあります。
以上、静かな一日ながらも、AI 分野の各所で進展が見られた一日でした。