2026-07-03 04:53 UTC+8站內改寫2 分鐘閱讀更新: 2026-07-03 05:36 UTC+8

AI Agent Qubitz：本地優先的AI代理，專為GGUF模型設計

Qubitz是一個完全本地的AI代理，使用llama.cpp的GGUF模型，透過專用封裝和路由機制，使7B-35B引數的小型模型更可靠。它支援多種模型變體、本地檢索、GUI/CLI/MCP模式，並在WSL2/Windows環境下執行，無需雲服務或訂閱。

來源Hacker News AI作者: Gabrieliam42

Qubitz 是一個開源的本地優先 AI 代理專案，專為在 llama.cpp 上執行的 GGUF 模型設計。其核心創新在於一個專用的“封裝”（harness）和“包裝器”（wrapper）架構，將路由、工作區處理、檢索和工具編排等任務集中在包裝器控制下，從而讓 7B 到 35B 引數的小型模型更可靠、更可預測。與大多數 AI 代理依賴雲端 API 或訂閱不同，Qubitz 完全在本地執行，無需任何外部服務。

Qubitz 提供了多種模型變體指令碼，覆蓋從 8B 到 35B 的不同規模，包括 Qwen 3.5 9B Q8（12GB VRAM）、Granite 4.1 8B Q8（12GB VRAM）、GLM 4.7 Flash（24GB）、Devstral Small 2（24GB）、Gemma 4 31B IT QAT（24GB）、GPT-OSS 20B F16（24GB）、Ornith-1.0-35B MoE（24GB）、Qwen 3.6 27B Dense（24GB）以及 Qwen 3.6 35B A3B MoE MTP（24GB）等。每個指令碼都整合了 BAAI/bge-code-v1 嵌入模型以提供專案上下文。使用者可以透過 Tk 圖形介面、命令列或 MCP 伺服器模式與之互動。

對於簡單問題，系統採用快速路徑跳過檢索和擴充套件；對於複雜任務，則會按需觸發檢索和工具呼叫。特別的是，Qubitz 可以直接執行現有的專案入口指令碼（如 .py、.sh、.bat、.cmd、uv run、npm run、pnpm run 和 make 任務），避免不必要的模型迴圈。包裝器提供的執行時事實可以指導 WSL/Windows 執行行為，小型模型無需自行推斷互操作規則。

該代理主要針對 WSL2/Linux 環境設計，但也能透過 WSL 到 Windows 的橋接訪問 Windows 工作區。設定過程簡單：在 WSL 中建立虛擬環境，安裝依賴，然後執行相應的變體指令碼即可。Qubitz 還包含一個加密的封裝檔案（HARNESS.enc）和本地金鑰檔案，用於載入執行時規則。封裝檔案被排除在正常檢索上下文之外，防止加密副本被注入。重要選項包括 --num-ctx、--num-predict、--max-steps 和 --thinking-effort（支援 default、low、medium、high、xhigh），在 GUI 中右下角的 Effort 選擇器對應相同的預設。

總體而言，Qubitz 在本地、隱私優先的場景下表現出色，尤其適合需要可控、可預測行為的小型模型代理使用者。它不追求與雲端前沿模型在原始智慧上競爭，而是在自身定位上提供了實用、可靠的解決方案。對於注重隱私、不想使用付費服務、需要本地控制和 WSL/Windows 操作的使用者來說，Qubitz 是一個值得關注的選擇。