Docker AI Stack:一条命令部署8个自托管AI服务
Docker AI Stack 项目提供了一套完整的自托管AI服务栈,包括 Ollama、LiteLLM、语音识别、文本转语音、文档解析等,只需一条命令即可部署。所有服务自动配置,API密钥自动生成,数据完全本地处理,支持GPU加速和轻量级配置。
文章情报
要点
- 一条命令部署8个自托管AI服务,零配置,自动生成API密钥
- 支持本地LLM、语音识别、文本转语音、文档解析和MCP工具
- 默认无API密钥要求,适合内网;公网部署需设置反向代理和密钥
- 提供多种轻量级子栈,内存最低约2.5 GB,支持NVIDIA GPU加速
为什么重要
这条新闻值得关注,因为一条命令部署8个自托管AI服务,零配置,自动生成API密钥。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
Docker AI Stack 是一个开源项目,旨在让用户通过一条命令即可在自己的服务器上部署一套完整的自托管AI服务栈。该项目托管在 GitHub 上,提供 Docker Compose 文件,集成了8个核心AI服务:Ollama(本地大语言模型)、LiteLLM(AI网关,可路由到100多个提供商)、Embeddings(文本向量化)、Whisper(语音转文字)、WhisperLive(实时语音转文字)、Kokoro(文本转语音)、MCP Gateway(MCP工具网关)和 Docling(文档解析)。
项目的核心优势在于零配置和安全性。所有服务在首次启动时自动配置,Ollama、LiteLLM 和 MCP Gateway 会自动生成API密钥并存储在共享卷中,无需手动干预。数据隐私是重点:音频、向量嵌入和LLM推理全部在本地运行,不会将数据发送到第三方。不过,如果通过LiteLLM使用外部提供商(如OpenAI、Anthropic),数据会发送到相应提供商。
部署非常简单。用户只需克隆仓库并运行 docker compose up -d,然后拉取一个模型(如 llama3.2:3b),即可开始使用。项目还提供了健康检查脚本 stack-check.sh 来验证所有服务是否正常运行。对于需要GPU加速的用户,可以使用CUDA版本的文件,前提是已安装NVIDIA驱动和容器工具包。
为了降低资源消耗,项目提供了多种轻量级子栈,例如仅需约2.5 GB内存的纯聊天子栈(Ollama + LiteLLM),以及语音管道、RAG管道等。用户可以根据需求选择启动最少的服务。此外,项目也支持在没有 Docker Compose 的情况下使用 docker run 命令逐个启动服务,并通过共享网络实现容器间通信。
项目还提供了详细的示例,包括完整的语音管道(语音输入→转文字→LLM→语音输出)和RAG管道(文档嵌入→向量检索→LLM问答)。MCP Gateway 允许AI客户端(如Cline in VS Code)通过标准MCP协议访问文件系统、GitHub等工具。
对于公网部署,项目建议在服务前放置反向代理(如Caddy或Nginx)以启用HTTPS,并设置默认可选认证服务的API密钥。备份恢复也得到支持,API密钥、模型和配置存储在Docker卷中。
总之,Docker AI Stack 为开发者和爱好者提供了一种快速、私有、灵活的方式,在自有硬件上搭建完整的AI服务环境。