AI News HubLIVE
站内改写2 分で読了

Show HN: Nenya – Goで書かれた軽量で高セキュリティなAI APIゲートウェイ/プロキシ

NenyaはGoで書かれた軽量で依存関係ゼロのAI APIゲートウェイです。AIコーディングクライアントとLLMプロバイダの間に位置し、シークレット編集、コンテキスト管理、エージェントルーティング、MCPツール統合を透過的なSSEストリーミングで提供します。セキュリティ機能には非root実行、mlockによるシークレット保護、seccomp、no-new-privilegesが含まれます。

ソースHacker News AI著者: garou

NenyaはGoで書かれた軽量なAI APIゲートウェイであり、AIコーディングクライアント(Cursor、OpenCode、Aiderなど)と上位LLMプロバイダの間で透過的なミドルウェアとして機能します。シークレット編集、コンテキスト管理、エージェントルーティング、MCPツール統合を提供し、すべて透過的なSSEストリームを介して行われます。このプロジェクトは依存関係ゼロの原則に従い、Go標準ライブラリのみを使用することで軽量性と信頼性を確保しています。

NenyaはOpenAIまたはAnthropic Chat Completions APIを実装する任意のプロバイダをサポートし、23のプロバイダ向けの専用アダプタがビルトインされており、それらの間のフォーマットの違いを処理します。設定駆動のプロバイダレジストリにより動的なモデル検出が可能で、3層のモデル解決(設定オーバーライド > 検出モデル > 静的レジストリ)をサポートします。さらに、エージェントのフォールバックチェーンを提供し、ラウンドロビンまたはシーケンシャルなフォールバックとサーキットブレーカ、自動フェイルオーバーを備えています。レイテンシ認識ルーティングは、過去の応答時間の中央値に基づいてターゲットを自動的に並べ替え、±5%のジッターを追加して群集効果を防ぎます。

セキュリティとプライバシーに関して、Nenyaは多層的な保護を実装しています。常時オンになっているTier-0正規表現シークレットフィルタが、AWSキー、GitHubトークン、パスワードなどの機密情報を編集します。3層のコンテンツパイプラインには、プラグ可能なインターセプタチェーン(正規表現編集、エントロピーフィルタリング、TF-IDF関連性スコアリング、エンジン要約)が含まれます。さらに、コンテキストウィンドウ圧縮、古いツールコールのトリミング、思考ブロックのトリミングをサポートしています。入力検証には、厳格なリクエストボディ制限、JSONサニタイゼーション、ヘッダーフィルタリングが含まれます。パイプラインが失敗した場合でも、システムは優雅に劣化し、リクエストがブロックされることはありません。

ロールベースアクセスコントロール(RBAC)により、APIキーのロール(管理者、ユーザ、読み取り専用)に基づいて特定のエージェントとエンドポイントへのアクセスを制限できます。セキュアメモリはmlockで保護されたトークンストレージを使用し、初期化後に読み取り専用にシールし、コアダンプを防止します。デプロイセキュリティに関しては、Nenyaはデフォルトで非rootユーザ(UID 65532)で実行され、読み取り専用ファイルシステム、seccomp、no-new-privilegesを備え、systemdクレデンシャルまたはコンテナマウントを介してシークレットをロードし、ディスクに書き込むことはありません。

NenyaはMCP(モデルコンテキストプロトコル)ツールも統合しており、自動ツール検出、マルチターン実行、自動保存をサポートしています。MCPサーバーから関連コンテンツをプリフェッチし、アシスタントの応答をMCPメモリサーバーに永続化できます。

このプロジェクトは、Podman、Homebrew、パッケージマネージャ(Debian、Fedora、Arch、Nix)、コンテナ、Kubernetesなど、複数のクイックスタート方法を提供しています。ランタイム設定は環境変数を介して行われ、ホットリロードとゼロダウンタイム再起動をサポートします。APIエンドポイントには、標準のOpenAIおよびAnthropic互換インターフェースに加え、ヘルスチェック、統計、Prometheusメトリクスエンドポイントが含まれます。

Nenyaのアーキテクチャドキュメント、設定リファレンス、デプロイガイドなどはGitHubリポジトリで入手できます。このプロジェクトはApache 2.0ライセンスの下で提供されています。