AI News HubLIVE
サイト内リライト2 分で読了

私が最近取り組んでいること:ATOMレポート、ポストトレーニングコース、本の完成、そして進行中の研究

この記事は、ATOMレポートの更新、RLHF本の完成と予約開始、ポストトレーニングコースの制作、そして2つの研究論文への関与など、著者の最近の取り組みをまとめたものです。

ソースInterconnects (Nathan Lambert)著者: Nathan Lambert

本記事は、著者が最近取り組んでいたプロジェクトのラウンドアップです。個別の記事に値しないものの、その意義と成果を共有します。

1. ATOMレポート:オープン言語モデルエコシステムの測定

2025年8月に公開されたATOMプロジェクトメモ(米国におけるオープンモデルへの投資を主張するマニフェスト)に伴い、最新データと分析を盛り込んだ技術レポートが更新されました。このレポートでは、GPT-OSSの台頭、推論市場シェア、中国の中堅プレイヤー(Moonshot、Z.ai、MiniMaxなど)の影響力、そして米国におけるオープンモデルの進展などを詳述。特に、相対採用指標(RAM)を更新し、モデルの採用状況を時間変動とサイズ正規化で評価します。RAMスコアが1を超えると、そのモデルはサイズカテゴリ内で歴代トップ10のダウンロード数になると予測されます。最近のGemma 4の初期採用データも分析されています。

2. RLHF本完成、予約開始

著者は、ポストトレーニングに取り組み始めた頃に欲しかった本を執筆。2024年5月20日にドメインを取得し、先日マニング社に原稿を納品。印刷まで約2か月です。現在はコードとコースの開発に注力。AmazonとManningで予約受付中。

3. ポストトレーニングコース制作中

本を補完する学習体験として、無料の講義シリーズをYouTubeで公開。現在4つの講義がアップロード済みで、コミュニティのQ&Aも取り入れます。今夏はコードベースの開発や対面イベントを計画。

4. 最近の技術研究

著者は以下の2本の論文に参加:

  • TurnWise:マルチターンダイアログにおけるモデルの能力差、トレーニングデータ作成方法、ポストトレーニングの特異性を探る。著者の関心はエージェントに移行し、マルチターン対話を重要なユーザーインターフェース問題と捉えています。
  • エージェント検索のための自己内省を用いたメタ強化学習:RLVRによる問題解決をメタ学習問題と捉え、過去の試行からのコンテキストを活用。この研究は継続学習やテスト時学習の関連研究と連携。

著者は今後数ヶ月で中国(その後ワシントンDC)を訪れ、AI進歩に対する世界の見方をさらに学ぶ予定です。