2026-05-13站内改写

LangSmith LLM Gateway：エージェントライフサイクルに組み込まれたランタイムガバナンス

LangSmithは、LLM Gatewayのプライベートベータ版を発表。これは、リクエストがモデルに到達する前にコスト制限と機密データ編集を強制し、ポリシーイベントをLangSmithワークスペースに直接統合するランタイムガバナンスレイヤーです。

記事インテリジェンス

エンジニア中級

要点

LLM GatewayはエージェントとLLMプロバイダーの間に位置し、リクエストがモデルに到達する前に支出制限とPII編集を強制します。
ポリシー違反はLangSmith内でトレース可能なイベントとして表示され、ブロックされたリクエストからトリガートレース、修正までシームレスに調査できます。
セットアップはベースURLをゲートウェイエンドポイントに変更するだけで完了し、プロバイダーキーを追加し、UIでポリシーを設定します。
階層的な強制、監査ログ、リアルタイムのコスト可視性、およびLangSmith Engineとの統合を提供します。

重要な理由

このニュースが重要なのは、LLM GatewayはエージェントとLLMプロバイダーの間に位置し、リクエストがモデルに到達する前に支出制限とPII編集を強制しますためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

LangSmithは本日、LLM Gatewayのプライベートベータ版を発表しました。これは、エージェントの構築、観察、評価を行うLangSmith環境に組み込まれたランタイムガバナンスレイヤーです。LLM GatewayはエージェントとLLMプロバイダーの間に位置し、リクエストがモデルに到達する前にコスト制限と機密データ編集を強制します。ポリシーが発動すると、イベントは個別のダッシュボードや監査ログを必要とせずに直接LangSmithに流れ込みます。開発者は、ブロックされたリクエストからそのトリガーとなったトレース、そして修正まで、すべて同じ製品内で行えます。

LLM Gatewayは、観測可能性と強制のギャップを埋めます。たとえば、コーディングエージェントが夜間にリトライループに陥り、朝までに10,000回のLLM呼び出しで4桁の請求書が発生するケースや、カスタマーサポートエージェントが社会保障番号を含む返金リクエストを処理し、その番号がLLMプロバイダーのログやトレースデータ、ダウンストリームシステムに残ってしまうケースなどです。観測可能性は何が起こったかを教えてくれますが、LLM Gatewayは問題が発生する前に防ぎます。

現在のベータ版には以下の機能が含まれます：支出制限（組織、ワークスペース、ユーザー、APIキーレベルで上限を設定し、超過時に402エラーを返す）、リアルタイムのコスト集計、PIIと機密情報の検出（リクエストとレスポンスから機密データを編集）、トレース継続性（ゲートウェイ経由の呼び出しも同じLangSmithワークスペースに表示）、LangSmith Engine統合（ポリシーイベントをトリアージに活用）、監査ログ（すべての管理操作を記録）、階層的な強制。

セットアップは意図的にシンプルです。エージェントのベースURLをLangSmith Gatewayエンドポイントに変更し、LangSmith APIキーを使用します。プロバイダーAPIキーをワークスペースシークレットに追加し、LangSmith UIでポリシーを設定するだけです。コードを変更する必要はありません。

LLM Gatewayはエージェントフレームワーク自体に固定されており、ポリシーイベントがトレース、評価、ダッシュボードと同じワークスペースに流れ込みます。これにより、検出、調査、修正がすべてエージェント構築の同じ表面で行われます。ネットワークレイヤーゲートウェイ、スタンドアロンのガードレールプラットフォーム、データプラットフォームのガバナンスレイヤーとは異なり、LLM Gatewayはエージェントフレームワークに固定されているため、複数のツールを切り替える必要がありません。

今後の計画には、より深いセキュリティ制御（PIIと機密検出を超えたリスクカバー）、柔軟な強制（ソフトリリース、モデルフォールバック、レート制限）、ツールとMCPゲートウェイ（同じ強制プリミティブをツールコール、エージェント間コール、MCPサーバーインタラクションに適用）が含まれます。LLM Gatewayは現在プライベートベータ版で利用可能であり、アクセスをリクエストできます。