AI News HubLIVE
站內改寫2 分鐘閱讀

AI Agent Qubitz:本地優先的AI代理,專為GGUF模型設計

Qubitz是一個完全本地的AI代理,使用llama.cpp的GGUF模型,透過專用封裝和路由機制,使7B-35B引數的小型模型更可靠。它支援多種模型變體、本地檢索、GUI/CLI/MCP模式,並在WSL2/Windows環境下執行,無需雲服務或訂閱。

來源Hacker News AI作者: Gabrieliam42

Qubitz 是一個開源的本地優先 AI 代理專案,專為在 llama.cpp 上執行的 GGUF 模型設計。其核心創新在於一個專用的“封裝”(harness)和“包裝器”(wrapper)架構,將路由、工作區處理、檢索和工具編排等任務集中在包裝器控制下,從而讓 7B 到 35B 引數的小型模型更可靠、更可預測。與大多數 AI 代理依賴雲端 API 或訂閱不同,Qubitz 完全在本地執行,無需任何外部服務。

Qubitz 提供了多種模型變體指令碼,覆蓋從 8B 到 35B 的不同規模,包括 Qwen 3.5 9B Q8(12GB VRAM)、Granite 4.1 8B Q8(12GB VRAM)、GLM 4.7 Flash(24GB)、Devstral Small 2(24GB)、Gemma 4 31B IT QAT(24GB)、GPT-OSS 20B F16(24GB)、Ornith-1.0-35B MoE(24GB)、Qwen 3.6 27B Dense(24GB)以及 Qwen 3.6 35B A3B MoE MTP(24GB)等。每個指令碼都整合了 BAAI/bge-code-v1 嵌入模型以提供專案上下文。使用者可以透過 Tk 圖形介面、命令列或 MCP 伺服器模式與之互動。

對於簡單問題,系統採用快速路徑跳過檢索和擴充套件;對於複雜任務,則會按需觸發檢索和工具呼叫。特別的是,Qubitz 可以直接執行現有的專案入口指令碼(如 .py、.sh、.bat、.cmd、uv run、npm run、pnpm run 和 make 任務),避免不必要的模型迴圈。包裝器提供的執行時事實可以指導 WSL/Windows 執行行為,小型模型無需自行推斷互操作規則。

該代理主要針對 WSL2/Linux 環境設計,但也能透過 WSL 到 Windows 的橋接訪問 Windows 工作區。設定過程簡單:在 WSL 中建立虛擬環境,安裝依賴,然後執行相應的變體指令碼即可。Qubitz 還包含一個加密的封裝檔案(HARNESS.enc)和本地金鑰檔案,用於載入執行時規則。封裝檔案被排除在正常檢索上下文之外,防止加密副本被注入。重要選項包括 --num-ctx、--num-predict、--max-steps 和 --thinking-effort(支援 default、low、medium、high、xhigh),在 GUI 中右下角的 Effort 選擇器對應相同的預設。

總體而言,Qubitz 在本地、隱私優先的場景下表現出色,尤其適合需要可控、可預測行為的小型模型代理使用者。它不追求與雲端前沿模型在原始智慧上競爭,而是在自身定位上提供了實用、可靠的解決方案。對於注重隱私、不想使用付費服務、需要本地控制和 WSL/Windows 操作的使用者來說,Qubitz 是一個值得關注的選擇。