AI News HubLIVE
站內改寫2 分鐘閱讀

AI Agent Qubitz:本地優先的AI代理,專為GGUF模型設計

Qubitz是一個完全本地的AI代理,使用llama.cpp的GGUF模型,通過專用封裝和路由機制,使7B-35B參數的小型模型更可靠。它支持多種模型變體、本地檢索、GUI/CLI/MCP模式,並在WSL2/Windows環境下運行,無需雲服務或訂閲。

來源Hacker News AI作者: Gabrieliam42

Qubitz 是一個開源的本地優先 AI 代理項目,專為在 llama.cpp 上運行的 GGUF 模型設計。其核心創新在於一個專用的“封裝”(harness)和“包裝器”(wrapper)架構,將路由、工作區處理、檢索和工具編排等任務集中在包裝器控制下,從而讓 7B 到 35B 參數的小型模型更可靠、更可預測。與大多數 AI 代理依賴雲端 API 或訂閲不同,Qubitz 完全在本地運行,無需任何外部服務。

Qubitz 提供了多種模型變體腳本,覆蓋從 8B 到 35B 的不同規模,包括 Qwen 3.5 9B Q8(12GB VRAM)、Granite 4.1 8B Q8(12GB VRAM)、GLM 4.7 Flash(24GB)、Devstral Small 2(24GB)、Gemma 4 31B IT QAT(24GB)、GPT-OSS 20B F16(24GB)、Ornith-1.0-35B MoE(24GB)、Qwen 3.6 27B Dense(24GB)以及 Qwen 3.6 35B A3B MoE MTP(24GB)等。每個腳本都集成了 BAAI/bge-code-v1 嵌入模型以提供項目上下文。用户可以通過 Tk 圖形界面、命令行或 MCP 服務器模式與之交互。

對於簡單問題,系統採用快速路徑跳過檢索和擴展;對於複雜任務,則會按需觸發檢索和工具調用。特別的是,Qubitz 可以直接執行現有的項目入口腳本(如 .py、.sh、.bat、.cmd、uv run、npm run、pnpm run 和 make 任務),避免不必要的模型循環。包裝器提供的運行時事實可以指導 WSL/Windows 執行行為,小型模型無需自行推斷互操作規則。

該代理主要針對 WSL2/Linux 環境設計,但也能通過 WSL 到 Windows 的橋接訪問 Windows 工作區。設置過程簡單:在 WSL 中創建虛擬環境,安裝依賴,然後運行相應的變體腳本即可。Qubitz 還包含一個加密的封裝文件(HARNESS.enc)和本地密鑰文件,用於加載運行時規則。封裝文件被排除在正常檢索上下文之外,防止加密副本被注入。重要選項包括 --num-ctx、--num-predict、--max-steps 和 --thinking-effort(支持 default、low、medium、high、xhigh),在 GUI 中右下角的 Effort 選擇器對應相同的預設。

總體而言,Qubitz 在本地、隱私優先的場景下表現出色,尤其適合需要可控、可預測行為的小型模型代理用户。它不追求與雲端前沿模型在原始智能上競爭,而是在自身定位上提供了實用、可靠的解決方案。對於注重隱私、不想使用付費服務、需要本地控制和 WSL/Windows 操作的用户來説,Qubitz 是一個值得關注的選擇。