2026-07-03 04:53 UTC+8站内改写2 分钟阅读更新: 2026-07-03 05:36 UTC+8

AI Agent Qubitz：本地优先的AI代理，专为GGUF模型设计

Qubitz是一个完全本地的AI代理，使用llama.cpp的GGUF模型，通过专用封装和路由机制，使7B-35B参数的小型模型更可靠。它支持多种模型变体、本地检索、GUI/CLI/MCP模式，并在WSL2/Windows环境下运行，无需云服务或订阅。

来源Hacker News AI作者: Gabrieliam42

Qubitz 是一个开源的本地优先 AI 代理项目，专为在 llama.cpp 上运行的 GGUF 模型设计。其核心创新在于一个专用的“封装”（harness）和“包装器”（wrapper）架构，将路由、工作区处理、检索和工具编排等任务集中在包装器控制下，从而让 7B 到 35B 参数的小型模型更可靠、更可预测。与大多数 AI 代理依赖云端 API 或订阅不同，Qubitz 完全在本地运行，无需任何外部服务。

Qubitz 提供了多种模型变体脚本，覆盖从 8B 到 35B 的不同规模，包括 Qwen 3.5 9B Q8（12GB VRAM）、Granite 4.1 8B Q8（12GB VRAM）、GLM 4.7 Flash（24GB）、Devstral Small 2（24GB）、Gemma 4 31B IT QAT（24GB）、GPT-OSS 20B F16（24GB）、Ornith-1.0-35B MoE（24GB）、Qwen 3.6 27B Dense（24GB）以及 Qwen 3.6 35B A3B MoE MTP（24GB）等。每个脚本都集成了 BAAI/bge-code-v1 嵌入模型以提供项目上下文。用户可以通过 Tk 图形界面、命令行或 MCP 服务器模式与之交互。

对于简单问题，系统采用快速路径跳过检索和扩展；对于复杂任务，则会按需触发检索和工具调用。特别的是，Qubitz 可以直接执行现有的项目入口脚本（如 .py、.sh、.bat、.cmd、uv run、npm run、pnpm run 和 make 任务），避免不必要的模型循环。包装器提供的运行时事实可以指导 WSL/Windows 执行行为，小型模型无需自行推断互操作规则。

该代理主要针对 WSL2/Linux 环境设计，但也能通过 WSL 到 Windows 的桥接访问 Windows 工作区。设置过程简单：在 WSL 中创建虚拟环境，安装依赖，然后运行相应的变体脚本即可。Qubitz 还包含一个加密的封装文件（HARNESS.enc）和本地密钥文件，用于加载运行时规则。封装文件被排除在正常检索上下文之外，防止加密副本被注入。重要选项包括 --num-ctx、--num-predict、--max-steps 和 --thinking-effort（支持 default、low、medium、high、xhigh），在 GUI 中右下角的 Effort 选择器对应相同的预设。

总体而言，Qubitz 在本地、隐私优先的场景下表现出色，尤其适合需要可控、可预测行为的小型模型代理用户。它不追求与云端前沿模型在原始智能上竞争，而是在自身定位上提供了实用、可靠的解决方案。对于注重隐私、不想使用付费服务、需要本地控制和 WSL/Windows 操作的用户来说，Qubitz 是一个值得关注的选择。