2026-06-30 07:58 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 08:25 UTC+8

自託管現代AI堆疊：llmaker讓私有部署一步到位

llmaker是一個開源平臺，允許使用者在自己的基礎設施上執行完整的現代LLM堆疊，包括大語言模型、向量資料庫、嵌入、快取、可觀測性和內建的檢索與代理層。透過單個命令即可完成配置和部署，無需第三方API金鑰，確保資料完全私有。

來源Hacker News AI作者: sleepynoodle

近日，開源社群出現了一款名為llmaker的工具，旨在簡化自託管大型語言模型（LLM）堆疊的複雜性。該平臺允許開發者在自己的硬體上執行完整的現代AI堆疊，包括大語言模型、向量資料庫、嵌入服務、快取層、可觀測性以及一個內建的檢索與代理層，全部透過一條命令完成配置和部署。

llmaker的核心理念是解決當前部署LLM應用時面臨的“組裝稅”問題。通常，執行一個模型本地很簡單，但構建一個可生產的檢索系統需要整合向量資料庫、嵌入服務、快取、編排層和可觀測性——每個元件都需要容器化、聯網和配置才能相互發現。這通常會導致大量的Docker執行命令、脆弱的Compose檔案以及數百行的框架膠水程式碼。llmaker透過一個統一的CLI消除了這種開銷，將整個堆疊部署在私有網路上，並以單一艦隊模式執行，提供即時狀態、日誌和資源儀表板。

該平臺支援多種預設的應用堆疊，包括“assistant”（私有ChatGPT風格助手）、“voice”（語音對話）、“rag”（文件問答）、“research”（工具輔助研究）、“code”（程式碼助手）、“chatbot”（多輪對話）、“faq”（知識庫問答）、“recommend”（語義推薦）以及“sql”（自然語言資料庫查詢）。使用者可以使用llmaker stack up命令快速搭建這些堆疊，或者透過llmaker stack init生成可編輯的YAML配置檔案，然後使用llmaker apply進行宣告式部署。

llmaker的代理層是核心元件之一，它基於FastAPI和LangGraph構建，提供了完整的檢索增強生成（RAG）流程：重寫查詢、檢索文件、重新排序和生成答案。代理還支援工具呼叫，包括計算器、知識庫、自託管網路搜尋（透過SearXNG）以及可選的只讀SQL工具。所有查詢都會自動追蹤到Langfuse，實現零配置的可觀測性。

此外，llmaker強調隱私和成本可預測性。預設情況下，所有容器繫結到127.0.0.1，文件、嵌入和追蹤資料都不會離開使用者的基礎設施。沒有按token計費，沒有速率限制，使用者只需為已擁有的硬體付費。平臺還支援OpenAI相容的API，因此現有應用可以無縫遷移。

llmaker的安裝非常簡單，需要Docker環境。使用者可以透過curl指令碼、Go工具鏈或從原始碼編譯安裝。安裝後執行llmaker doctor驗證環境即可開始使用。該專案的GitHub儲存庫提供了詳細的文件、示例和命令列參考。

總體而言，llmaker為希望自託管AI堆疊的開發者和企業提供了一個強大且易用的解決方案，降低了部署門檻，同時保證了資料主權和成本控制。隨著開源社群的持續貢獻，該平臺有望成為自託管AI領域的重要工具。