AIの4つの特性
このチュートリアルでは、AIの4つの主要な特性(次トークン予測、知識、作業記憶、操作可能性)を説明します。各特性には能力と限界があり、Claudeの機能でそれらを緩和します。
Anthropicは、最新のチュートリアルで「AIの4つの特性」というフレームワークを提唱し、生成AIの能力と限界を深く理解する手助けをしています。これら4つの特性は、次トークン予測、知識、作業記憶、操作可能性です。それぞれの特性は、AIに独自の利点をもたらす一方で、固有の課題も伴います。
次トークン予測
生成AIの核心メカニズムは次トークン予測です。AIは、次に来る可能性が最も高いトークンを逐次予測して回答を生成します。これは、検索エンジンではなく、極めて高度なオートコンプリートのようなものです。この特性により、AIは流暢で自然なテキストを生成し、大量の情報を素早く統合し、訓練データに似たタスクで優れたパフォーマンスを発揮できます。しかし、その一方で、有名な「幻覚」問題を引き起こします。AIはもっともらしいが誤った回答を生成することがあり、特に名前、日付、引用、統計などの具体的な詳細で顕著です。AIは自分の出力に自信を持っているため、ユーザーは事実と虚構を区別するのが難しい場合があります。この問題を軽減するため、Claudeは引用とソースの明示、制約付き生成、生成検証ループなどの機能を提供し、出力の正確性を確保しています。
知識
AIの知識はすべて訓練データに由来し、知識のカットオフ時点で固定されています。そのため、AIは非常に広範囲な一般知識を持ち、訓練データで十分にカバーされた分野では深い能力を発揮し、分野を超えた予期せぬ関連性を見出すこともできます。しかし、知識には明らかな限界があります。古さ(過去に正しかったことが現在も正しいとは限らない)、ニッチな話題や最近のトピックへの不均一なカバレッジ、そして「出典健忘症」—AIは正確な引用を提供できないことです。これらの欠点を補うため、Claudeはウェブ検索、検索拡張生成(RAG)、ツール使用などの機能を統合し、リアルタイム情報を取得して事実を検証できるようにしています。
作業記憶
AIの作業記憶は、固定サイズのコンテキストウィンドウに制限されています。すべてのやり取りはこのウィンドウ内で行われ、AIはユーザーが提供するドキュメント、データ、指示に迅速に適応できます。しかし、このウィンドウにはハードな長さ制限があり、それを超えるとパフォーマンスが急激に低下します(段階的ではなく崖のように落ちます)。また、ウィンドウの中央部分にある情報は無視されやすい(「中途半端迷子」効果)。デフォルトでは永続的な記憶がないため、以前の修正がその後の会話に引き継がれません。Claudeは、メモリ、プロジェクト、コンテキスト圧縮、ファイル添付などの機能で作業記憶を拡張し、より長く複雑なタスクを処理できるようにしています。
操作可能性
AIは意図を理解するのではなく、指示のパターンを継続することでタスクを実行します。そのため、非常に操作しやすいという特性があります。ユーザーはシステムプロンプトを通じて出力の形式、スタイル、長さ、トーンを正確に制御し、役割を設定し、複数ステップの操作を実行できます。しかし、この操作方法にはリスクもあります。推論ドリフト(長いチェーンで小さなエラーが蓄積)、言葉通りの解釈(指示は守られるが意図が誤解される)、プロンプトインジェクション(コンテキスト内の他のテキストが指示を妨害する)などです。Claudeは、システムプロンプト、拡張思考(visible thinking)、コード実行によって操作可能性を強化し、ユーザーがAIの行動をより適切に制御できるようにしています。
これらの4つの特性を理解することは、AIを効果的に活用するための鍵です。Anthropicは、実際の演習と実例を含む無料のAI能力と限界コースも提供しており、ユーザーが実際のアプリケーションでこれらの特性がもたらす課題を特定し、対処できるように支援しています。