AI News HubLIVE
站内改写2 分钟阅读

AI Agent Qubitz:本地优先的AI代理,专为GGUF模型设计

Qubitz是一个完全本地的AI代理,使用llama.cpp的GGUF模型,通过专用封装和路由机制,使7B-35B参数的小型模型更可靠。它支持多种模型变体、本地检索、GUI/CLI/MCP模式,并在WSL2/Windows环境下运行,无需云服务或订阅。

来源Hacker News AI作者: Gabrieliam42

Qubitz 是一个开源的本地优先 AI 代理项目,专为在 llama.cpp 上运行的 GGUF 模型设计。其核心创新在于一个专用的“封装”(harness)和“包装器”(wrapper)架构,将路由、工作区处理、检索和工具编排等任务集中在包装器控制下,从而让 7B 到 35B 参数的小型模型更可靠、更可预测。与大多数 AI 代理依赖云端 API 或订阅不同,Qubitz 完全在本地运行,无需任何外部服务。

Qubitz 提供了多种模型变体脚本,覆盖从 8B 到 35B 的不同规模,包括 Qwen 3.5 9B Q8(12GB VRAM)、Granite 4.1 8B Q8(12GB VRAM)、GLM 4.7 Flash(24GB)、Devstral Small 2(24GB)、Gemma 4 31B IT QAT(24GB)、GPT-OSS 20B F16(24GB)、Ornith-1.0-35B MoE(24GB)、Qwen 3.6 27B Dense(24GB)以及 Qwen 3.6 35B A3B MoE MTP(24GB)等。每个脚本都集成了 BAAI/bge-code-v1 嵌入模型以提供项目上下文。用户可以通过 Tk 图形界面、命令行或 MCP 服务器模式与之交互。

对于简单问题,系统采用快速路径跳过检索和扩展;对于复杂任务,则会按需触发检索和工具调用。特别的是,Qubitz 可以直接执行现有的项目入口脚本(如 .py、.sh、.bat、.cmd、uv run、npm run、pnpm run 和 make 任务),避免不必要的模型循环。包装器提供的运行时事实可以指导 WSL/Windows 执行行为,小型模型无需自行推断互操作规则。

该代理主要针对 WSL2/Linux 环境设计,但也能通过 WSL 到 Windows 的桥接访问 Windows 工作区。设置过程简单:在 WSL 中创建虚拟环境,安装依赖,然后运行相应的变体脚本即可。Qubitz 还包含一个加密的封装文件(HARNESS.enc)和本地密钥文件,用于加载运行时规则。封装文件被排除在正常检索上下文之外,防止加密副本被注入。重要选项包括 --num-ctx、--num-predict、--max-steps 和 --thinking-effort(支持 default、low、medium、high、xhigh),在 GUI 中右下角的 Effort 选择器对应相同的预设。

总体而言,Qubitz 在本地、隐私优先的场景下表现出色,尤其适合需要可控、可预测行为的小型模型代理用户。它不追求与云端前沿模型在原始智能上竞争,而是在自身定位上提供了实用、可靠的解决方案。对于注重隐私、不想使用付费服务、需要本地控制和 WSL/Windows 操作的用户来说,Qubitz 是一个值得关注的选择。