Docker AI Stack:1つのコマンドで8つのセルフホストAIサービスを展開
Docker AI Stack プロジェクトは、Ollama、LiteLLM、音声認識、テキスト読み上げ、ドキュメント解析など、完全なセルフホストAIサービススタックを1つのコマンドで展開できるようにします。すべてのサービスは自動構成され、APIキーが自動生成され、データは完全にローカルで処理され、GPUアクセラレーションと軽量構成をサポートします。
記事インテリジェンス
要点
- 1つのコマンドで8つのセルフホストAIサービスを展開、ゼロ設定、自動APIキー生成
- ローカルLLM、音声認識、テキスト読み上げ、ドキュメント解析、MCPツールを搭載
- デフォルトでは認証不要でプライベート、公開展開にはリバースプロキシとキー設定が必要
- メモリ最低約2.5GBの軽量サブスタックがあり、NVIDIA GPUアクセラレーションをサポート
重要な理由
このニュースが重要なのは、1つのコマンドで8つのセルフホストAIサービスを展開、ゼロ設定、自動APIキー生成ためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
Docker AI Stack は、1つのコマンドで自分のサーバーに完全なAIサービススタックを展開できるオープンソースプロジェクトです。GitHubでホストされており、Docker Composeファイルを提供し、8つのコアAIサービスを統合しています:Ollama(ローカル大規模言語モデル)、LiteLLM(100以上のプロバイダーにルーティング可能なAIゲートウェイ)、Embeddings(テキストベクトル化)、Whisper(音声認識)、WhisperLive(リアルタイム音声認識)、Kokoro(テキスト読み上げ)、MCP Gateway(MCPツールゲートウェイ)、Docling(ドキュメント解析)。
このプロジェクトの主な利点は、ゼロ設定とセキュリティです。すべてのサービスは初回起動時に自動構成され、Ollama、LiteLLM、MCP Gatewayは自動的にAPIキーを生成し、共有ボリュームに保存します。データプライバシーが重視されており、音声、埋め込み、LLM推論はすべてローカルで実行され、データが第三者に送信されることはありません。ただし、LiteLLMを介して外部プロバイダー(OpenAI、Anthropicなど)を使用する場合、データはそれらのプロバイダーに送信されます。
展開は非常に簡単です。リポジトリをクローンし、「docker compose up -d」を実行してから、モデルをプル(例:「llama3.2:3b」)するだけです。プロジェクトには、すべてのサービスが正常に動作していることを確認するためのヘルスチェックスクリプト「stack-check.sh」も含まれています。GPUアクセラレーションが必要な場合は、CUDAバージョンのファイルを使用できます(NVIDIAドライバーとコンテナーツールキットが必要)。
リソース消費を抑えるために、プロジェクトは複数の軽量サブスタックを提供しています。たとえば、メモリ約2.5GBのチャット専用スタック(Ollama + LiteLLM)、音声パイプライン、RAGパイプラインなどがあります。ユーザーはニーズに応じて最小限のサービスのみを起動できます。また、Docker Composeを使用せずに「docker run」コマンドで個別にサービスを起動し、共有ネットワークを介してコンテナ間通信を行うことも可能です。
プロジェクトには、完全な音声パイプライン(音声入力→テキスト変換→LLM→音声出力)やRAGパイプライン(ドキュメント埋め込み→ベクトル検索→LLM Q&A)の詳細な例も含まれています。MCP Gatewayにより、AIクライアント(VS CodeのClineなど)は標準MCPプロトコルを介してファイルシステムやGitHubなどのツールにアクセスできます。
公開展開の場合、プロジェクトはサービス前面にリバースプロキシ(CaddyやNginxなど)を配置してHTTPSを有効にし、デフォルトでオプション認証のサービスにAPIキーを設定することを推奨しています。バックアップと復元もサポートされており、APIキー、モデル、設定はDockerボリュームに保存されます。
要約すると、Docker AI Stack は、開発者や愛好家が自前のハードウェア上で完全なAIサービス環境を迅速かつプライベートに、柔軟に構築する方法を提供します。