LLM研究論文:2025年版リスト(7月~12月)
著者が2025年7月から12月までの興味深い研究論文を厳選し、推論モデル、強化学習、アーキテクチャなどのカテゴリに分類して支援者に感謝の意を込めて共有します。
2025年6月、著者は有料購読者向けに、厳選された研究論文リストを含む特典記事を共有しました。同様に、全ての支援者への感謝として、2025年7月から12月までにブックマークし分類した興味深い研究記事のリストを準備しました。著者はこれらの論文の要旨に目を通しましたが、実際に読んだのはごく一部です。それでも、整理されたリストを収集し続けることを好んでおり、特定のプロジェクトに取り組む際に頻繁に参照しています。また、年次LLMレビュー記事『2025年のLLMの現状:進歩、問題、予測』も本日公開しました。当初はこのリストを上記の記事に含める予定でしたが、記事がすでに長くなっていたため、別の投稿としてリストを共有することにしました。これにより、両方の記事が読みやすく、スキャンしやすく、後で参照しやすくなると考えています。
研究論文リストのカテゴリは以下の通りです。まず、推論モデルには、推論モデルのトレーニング、推論時の推論戦略、LLMの評価と推論の理解が含まれます。この分野は、複雑なタスクにおける論理的推論能力を向上させることを目指しており、より強力な人工知能への重要な道筋です。次に、LLM向けの他の強化学習手法は、人間のフィードバックや自己対戦などを通じてモデルの動作を改善します。他の推論時スケーリング手法は、生成段階でより多くの計算リソースを投入して高品質な出力を得る手法(チェーン・オブ・ソートや自己整合性など)に焦点を当てています。モデルリリース/テクニカルレポートには、主要機関が発表した最新のLLMとその詳細な技術情報が含まれており、コミュニティにベンチマークと参考を提供します。アーキテクチャの研究では、効率的な注意機構やスパース活性化モデルなど、新しいネットワーク構造を探求し、計算コストを削減します。効率的なトレーニング技術は、データ効率、モデル並列化、分散トレーニング戦略に焦点を当て、大規模モデルのトレーニングをより実現可能にします。拡散ベースの言語モデルは新興分野であり、画像生成の成功をテキスト生成に応用し、段階的にノイズを除去してテキストを生成します。マルチモーダルおよび視覚言語モデルは、テキストと画像、動画などのモダリティを組み合わせ、クロスモーダルな理解と生成を推進します。データと事前学習データセットのカテゴリでは、データの品質、多様性、前処理方法に注目し、高品質なデータがモデル成功の基盤であると考えています。
このように整理されたリストを通じて、研究者やエンジニアは自分の関心分野を素早く見つけ、最新の進展を追跡し、実際のプロジェクトに活用できます。著者は、新しいプロジェクトを始める際に頻繁にこれらのリストを参照しており、読者にとっても同様に役立つと確信しています。このリストは支援者への感謝の表明であると同時に、わずか半年間のLLM分野における豊富な研究成果を示しており、将来のモデル選択、製品能力の向上、評価ベンチマークの設計において重要な参考資料となるでしょう。