2026-05-26 14:07 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

使用Docker Compose和MCP進行多智能體LLM編排

本文介紹了一本關於使用Docker和Kubernetes進行AI應用運營的新書，涵蓋LLM運行、MCP集成、自主智能體構建以及多智能體架構等主題，提供了從開發到生產的完整指南。

來源Hacker News AI作者: harsh_manvar

AI應用從原型到生產部署面臨諸多挑戰，包括模型管理、工具集成、安全性和可擴展性。一本新書《Operational AI with Docker: LLMOps, Agents and Multi-Model Systems with Docker and Kubernetes》由Packt出版，旨在通過Docker生態系統的工具解決這些問題。

該書圍繞Docker Desktop、Docker Model Runner、MCP Gateway等工具展開，指導讀者運行本地LLM、通過MCP（Model Context Protocol）連接外部系統、構建自主智能體，並最終在Kubernetes上編排多智能體系統。全書共9章，每章附帶可運行代碼。第1章介紹AI容器化基礎，包括Docker鏡像、容器、註冊表及與虛擬機的對比，通過兩個小示例使讀者熟悉docker run和docker build。第2章講解Docker中的模型管理，涵蓋OCI工件、GGUF格式、量化以及新的Compose模型語法，用於在服務旁聲明模型依賴。第3章聚焦Docker Model Runner的模型服務，從Docker Hub拉取模型，通過OpenAI兼容API調用，構建React聊天機器人，並集成Prometheus、Grafana和Jaeger進行可觀測性。第4章討論容器化模型導出和批處理，將模型導出、量化、批處理任務推送到專用容器中，保持主應用響應迅速。第5章將模型部署到Kubernetes，包括清單、資源限制、自動擴縮，以及一個可端到端部署的小型ML生態系統。第6章通過MCP賦予模型外部工具能力，使用Docker MCP Gateway和MCP Catalog（270多個服務器）連接AI到數據庫、API和工具，並實現隔離、密鑰管理和OAuth。第7章構建自主AI智能體，從“AI回答問題”邁向“AI執行操作”，涵蓋容器隔離的智能體、智能體間通信、發現、記憶/狀態、推理、工具訪問和沙箱。第8章探索多模型和多智能體架構，當單個智能體不足時，按複雜度路由任務，協調專業模型，構建多智能體研究助手。第9章涵蓋高級智能體編排和安全性，使用Docker Sandbox保護智能體執行，通過Docker Agent聲明式管理智能體團隊，在Kubernetes上使用kagent實現生產級智能體集羣，包括自動註冊、對等發現、分佈式追蹤和沙箱執行模式。

讀者需具備基本的命令行技能，推薦16GB RAM以流暢運行本地LLM。每章示例均可通過簡單的docker compose up啓動，例如第3章的聊天機器人。該書適用於DevOps工程師、AI/ML工程師等，期望將AI應用從“可在筆記本運行”提升至生產就緒狀態。書中示例已在macOS、Windows和Linux上測試。