2026-05-26 14:07 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

使用Docker Compose和MCP進行多智慧體LLM編排

本文介紹了一本關於使用Docker和Kubernetes進行AI應用運營的新書，涵蓋LLM執行、MCP整合、自主智慧體構建以及多智慧體架構等主題，提供了從開發到生產的完整指南。

來源Hacker News AI作者: harsh_manvar

AI應用從原型到生產部署面臨諸多挑戰，包括模型管理、工具整合、安全性和可擴充套件性。一本新書《Operational AI with Docker: LLMOps, Agents and Multi-Model Systems with Docker and Kubernetes》由Packt出版，旨在透過Docker生態系統的工具解決這些問題。

該書圍繞Docker Desktop、Docker Model Runner、MCP Gateway等工具展開，指導讀者執行本地LLM、透過MCP（Model Context Protocol）連線外部系統、構建自主智慧體，並最終在Kubernetes上編排多智慧體系統。全書共9章，每章附帶可執行程式碼。第1章介紹AI容器化基礎，包括Docker映象、容器、登錄檔及與虛擬機器的對比，透過兩個小示例使讀者熟悉docker run和docker build。第2章講解Docker中的模型管理，涵蓋OCI工件、GGUF格式、量化以及新的Compose模型語法，用於在服務旁宣告模型依賴。第3章聚焦Docker Model Runner的模型服務，從Docker Hub拉取模型，透過OpenAI相容API呼叫，構建React聊天機器人，並整合Prometheus、Grafana和Jaeger進行可觀測性。第4章討論容器化模型匯出和批處理，將模型匯出、量化、批處理任務推送到專用容器中，保持主應用響應迅速。第5章將模型部署到Kubernetes，包括清單、資源限制、自動擴縮，以及一個可端到端部署的小型ML生態系統。第6章透過MCP賦予模型外部工具能力，使用Docker MCP Gateway和MCP Catalog（270多個伺服器）連線AI到資料庫、API和工具，並實現隔離、金鑰管理和OAuth。第7章構建自主AI智慧體，從“AI回答問題”邁向“AI執行操作”，涵蓋容器隔離的智慧體、智慧體間通訊、發現、記憶/狀態、推理、工具訪問和沙箱。第8章探索多模型和多智慧體架構，當單個智慧體不足時，按複雜度路由任務，協調專業模型，構建多智慧體研究助手。第9章涵蓋高階智慧體編排和安全性，使用Docker Sandbox保護智慧體執行，透過Docker Agent宣告式管理智慧體團隊，在Kubernetes上使用kagent實現生產級智慧體叢集，包括自動註冊、對等發現、分散式追蹤和沙箱執行模式。

讀者需具備基本的命令列技能，推薦16GB RAM以流暢執行本地LLM。每章示例均可透過簡單的docker compose up啟動，例如第3章的聊天機器人。該書適用於DevOps工程師、AI/ML工程師等，期望將AI應用從“可在筆記本執行”提升至生產就緒狀態。書中示例已在macOS、Windows和Linux上測試。