ロールモデル:適切なジョブに適切なAIモデルを割り当てるためのプロトコル
role-modelは、能力を考慮したAIルーティングのためのオープンプロトコルであり、モデル名だけでなく、ロールとタスクのメタデータ、ルーティングポリシー、観測されたパフォーマンスに基づいてリクエストをルーティングします。リファレンスランタイム、説明可能なルーターの決定、および一般的なタスク(チャット、コード編集、レビュー、ツール使用、埋め込み、分類、言語検出など)のベースラインロールが含まれています。
role-modelは、能力を考慮したAIルーティングのためのオープンプロトコルであり、パッケージ化されたリファレンスルーターランタイムを提供します。システムはこれにより、リクエストに必要なもの、要求されているロールとタスク、作業を満たす具体的なエンドポイント、ポリシーが許可または禁止するもの、最終的なルーティング決定の理由を永続的に記述できます。ルーターはモデル名だけで選択するのではなく、ロールとタスクのメタデータ、宣言された能力、ルーティングポリシー、観測されたパフォーマンスを使用して、具体的なエンドポイント間でルーティングします。
このプロトコルは、ルーティングをいくつかの安定した部分に分割します:リクエストはタスクタイプ、必要な能力、モダリティ、ツールのニーズ、制約を記述します。ロールとタスクは作業のセマンティックな形状を記述します。エンドポイントのアイデンティティとプロファイルは、抽象的なモデル名ではなく、具体的なルーティング可能なエンドポイントを記述します。ルーティングポリシーは、ハード拒否、優先設定、予算、決定論的なタイブレークルールを適用します。可観測性アーティファクトは、決定、トレース、使用状況、測定されたパフォーマンスを記録します。これにより、ルーティングは説明可能で、異なるプロバイダー、ホスト、デプロイメント形状間で移植可能になります。
リファレンスルーターは安定したフローに従います:リクエストの意図を正規化し、効果的なポリシースナップショットを構築します。候補セットを絞り込み、要求されたロール、タスク、ポリシースコープに一致するエンドポイントのみを保持します。ハードな資格チェックを適用し、能力、モダリティ、ツール、場所、予算、バインディング要件を満たさないエンドポイントを拒否します。適格なエンドポイントをスコアリングし、測定された証拠、宣言されたデータ、ニュートラルなデフォルトを使用して、品質、レイテンシ、スループット、コスト、信頼性、優先設定を比較します。説明可能な決定を出力し、選択されたエンドポイント、フォールバック、除外、選択理由を含むRouterDecisionを返します。
現在のベースラインロールセットには、general.chat(一般的な会話応答)、coder.patch(パッチ指向のコード編集)、coder.review(レビュー、批評、構造化された判定)、tool.agent(ツールオーケストレーションと構造化されたツール呼び出し)、embedder(検索とベクトル生成)、classifier(ラベル付けと分類選択)、language.detector(言語識別)が含まれます。
初回セットアップの流れは次のとおりです:パッケージ化されたランタイムをインストールして起動し、実際に使用する予定のローカルまたはリモートエンドポイントを接続します。モデルをアクティブ化してロールを割り当て、実際の候補セットに対して完全なベンチマークを実行します。ベンチマーク結果を確認し、ルーティング戦略を選択して保存します。実際のルーティングリクエストで検証し、決定を検査します。下流のクライアント(Piなど)は、ランタイムがインストールされ構成された後に参加し、OpenAIディスカバリコントラクトを通じてrole-modelのエイリアスを発見します。これにより、ルーティング戦略の選択は推測ではなく証拠に基づいたものになります。