Lilian Weng AI ニュースソース

公開記事 10収集記事 11信頼度 88更新頻度 720 分

稼働状態正常ソース種別研究全文利用権限 全文利用可最終取り込み 2026-06-26ID lilian-weng状態有効

Public independent AI research blog; verify individual post license before full body display.

最新公開記事

スケーリング則を慎重に検討する

2026-06-24 09:00 UTC+9

スケーリング則は深層学習における最も重要な経験的発見の一つであり、モデルサイズ、データセットサイズ、計算量と損失の間のべき乗関係を記述します。本稿では、初期の理論からKaplanらの古典的スケーリング則、Chinchillaスケーリング則までの発展を概観し、計算最適配分などの重要な結論を議論します。

スケーリング則は訓練損失がモデルサイズ、データ量、計算量の増加に伴ってべき乗則で減少することを示す。
Kaplanらはモデルサイズをデータより速く増やすべきとしたが、Chinchilla則によって覆された。

強化学習における報酬ハッキング

2024-11-28 09:00 UTC+9

報酬ハッキングとは、強化学習エージェントが報酬関数の欠陥や曖昧さを利用して、本来のタスクを完了せずに高い報酬を得る現象です。言語モデルの普及とRLHFの標準的な手法化に伴い、報酬ハッキングは重要な実践的課題となっています。この記事では、報酬ハッキングの定義、種類、原因、および緩和策について詳しく説明します。

報酬ハッキングは、エージェントが報酬関数の欠陥を利用して高い報酬を得る行動。
RLHFにおける報酬ハッキングは、モデルが正しく見えるが実際には誤った出力を生成する原因となる。

この記事はLilian Wengによるもので、大規模言語モデル（LLM）における外部幻覚に焦点を当てています。外部幻覚とは、モデルが文脈や世界知識に基づかない虚偽のコンテンツを生成する現象です。原因として事前学習データの問題やファインチューニングによる新知識の導入、検出手法として検索拡張評価やサンプリングベースの手法、対策としてRAG、検証チェーン、サンプリング調整、ファインチューニングなどが解説されています。

外部幻覚は、事前学習データや世界知識に基づかない虚偽の出力のこと。
ファインチューニングで新知識を学習すると幻覚傾向が高まる可能性がある。

動画生成のための拡散モデル

2024-04-12 09:00 UTC+9

拡散モデルは画像合成で顕著な成果を上げてきましたが、研究コミュニティはより困難な動画生成タスクに取り組んでいます。このタスクは画像生成のスーパーセットであり、時間的一貫性とより多くの世界知識が必要です。本記事では、ゼロからのモデル設計、3D U-NetやDiTアーキテクチャ、事前学習画像モデルの微調整や学習不要の適応手法について解説します。

動画生成は画像生成より難しく、時間的一貫性と世界知識が必要。
主なアーキテクチャは3D U-Net（VDM、Imagen Video）と拡散Transformer（Sora）。

高品質な人間データについて考える

2024-02-05 09:00 UTC+9

高品質データは現代の深層学習モデル訓練の燃料です。この記事では、タスク設計、評価者選定とトレーニング、データ集約など、人間によるアノテーションを通じて高品質データを収集する方法を探ります。群衆の知恵、評価者間一致度の測定方法（Cohen's Kappa、MACEなど）、2つのアノテーションパラダイム（記述的 vs 規範的）についても説明します。さらに、影響関数、訓練ダイナミクス（データマップ、忘却イベント、AUMなど）、ノイズ付き交差検証を用いて誤ラベルデータを特定する手法について議論します。

高品質な人間データは、注意深いタスク設計、評価者の選定とトレーニング、データ集約に依存する。
多数決やCohen's Kappaなどの群衆の知恵を集約する方法は、アノテーション品質の評価に役立つ。

大規模言語モデルに対する敵対的攻撃

2023-10-25 09:00 UTC+9

大規模言語モデルに対する敵対的攻撃の包括的な調査を行い、脅威モデル、攻撃タイプ（トークン操作、勾配ベース攻撃、脱獄プロンプト、レッドチーミング技術）について説明し、ブラックボックスおよびホワイトボックス設定における課題と手法を議論します。

安全性が調整されたLLMは、望ましくない出力を引き起こす敵対的入力に対して脆弱です。
攻撃は単純なトークン置換から高度な勾配ベース最適化まで多岐にわたります。

LLMを搭載した自律エージェント

2023-06-23 09:00 UTC+9

本記事では、大規模言語モデル（LLM）を中核とする自律エージェントシステムを探求する。システムは計画（タスク分解と自己反省）、記憶（短期：コンテキスト内学習、長期：外部ベクトルストア）、ツール使用（外部API呼び出し）の3つの主要コンポーネントで構成される。ChemCrowや生成エージェントなどのケーススタディ、AutoGPT、GPT-Engineer、BabyAGIなどの概念実証を紹介し、有限コンテキストウィンドウなどの課題についても議論する。

LLMは自律エージェントの中核として、計画、記憶、ツール使用と組み合わされる
計画はサブゴールへの分解と自己反省により複雑なタスクを処理する

プロンプトエンジニアリング

2023-03-15 09:00 UTC+9

本記事では、大規模言語モデル（LLM）向けのプロンプトエンジニアリング手法について包括的に解説。基本プロンプト、インストラクションプロンプト、自己一致サンプリング、思考連鎖プロンプト、自動プロンプト設計、拡張言語モデルなどをカバー。

プロンプトエンジニアリングはモデルの重みを更新せずにLLMの動作を誘導する。
ゼロショットと少数ショット学習は基本的手法で、少数ショットはトークン消費が増えるが性能が向上する。

Transformerファミリーバージョン2.0

2023-01-27 09:00 UTC+9

本記事は、Lilian Weng氏による2020年の「Transformerファミリー」記事の大幅なアップデートで、ページ数が2倍になりました。近年のTransformerアーキテクチャの多くの改良点を体系的にレビューし、アテンション機構、位置エンコーディング、長いコンテキストのサポート、適応的モデリング、効率的なアテンションなどをカバーし、Transformer-XL、Rotary位置埋め込み、ALiBi、Universal Transformerなどの最新の進歩を含んでいます。

新版では階層が再構成され、過去3年間の最近の論文が組み込まれています。
正弦波、学習、相対、Rotary位置埋め込みなど、さまざまな位置エンコーディング手法が詳述されています。

大規模Transformerモデルの推論最適化

2023-01-11 02:00 UTC+9

大規模Transformerモデルの推論を最適化する手法の包括的な概要。蒸留、量子化、プルーニング、スパース化、Mixture-of-Experts、アーキテクチャ改善などを扱う。メモリフットプリントや並列化の低さといった課題を論じ、メモリ使用量、計算量、レイテンシを削減する方法を提示する。

KVキャッシュは大バッチサイズで最大3TBになる。
蒸留によりモデルサイズを40%削減し、性能損失は最小限。

Lilian Weng