AI Agent Qubitz:ローカルファーストのAIエージェント、GGUFモデル向け
Qubitzは、llama.cppのGGUFモデルを使用した完全ローカルのAIエージェントで、専用ハーネスにより7B~35Bの小型モデルの信頼性を高めます。ラッパー制御のルーティング、ワークスペース処理、ツールオーケストレーションを備え、複数のモデルバリアント、ローカル検索、GUI/CLI/MCPモードをサポート。クラウドやサブスクリプションは不要。
Qubitzは、llama.cpp上のGGUFモデル向けに設計された、完全ローカルのAIエージェントプロジェクトです。その中核は専用のハーネスとラッパーアーキテクチャにあり、ルーティング、ワークスペース処理、検索、ツールオーケストレーションをラッパーの制御下に置くことで、7Bから35Bパラメータの小型モデルをより信頼性高く、予測可能にします。多くのAIエージェントがクラウドAPIやサブスクリプションに依存するのに対し、Qubitzは完全にローカルで動作し、外部サービスを一切必要としません。
Qubitzは、8Bから35Bまでのさまざまなサイズのモデルバリアントスクリプトを提供しており、Qwen 3.5 9B Q8(12GB VRAM)、Granite 4.1 8B Q8(12GB VRAM)、GLM 4.7 Flash(24GB)、Devstral Small 2(24GB)、Gemma 4 31B IT QAT(24GB)、GPT-OSS 20B F16(24GB)、Ornith-1.0-35B MoE(24GB)、Qwen 3.6 27B Dense(24GB)、Qwen 3.6 35B A3B MoE MTP(24GB)などが含まれます。各スクリプトには、プロジェクトコンテキストを提供するためにBAAI/bge-code-v1埋め込みモデルが統合されています。ユーザーはTk GUI、コマンドライン、またはMCPサーバーモードで操作できます。
簡単な質問には、検索や拡張をスキップする高速パスが使用され、複雑なタスクには必要に応じて検索とツール呼び出しが実行されます。特に、Qubitzは既存のプロジェクトエントリポイントスクリプト(.py、.sh、.bat、.cmd、uv run、npm run、pnpm run、makeタスクなど)を直接実行でき、不必要なモデルループを回避します。ラッパーが提供するランタイムファクトがWSL/Windowsの実行動作を導くため、小型モデルが相互運用ルールをゼロから推論する必要はありません。
このエージェントは主にWSL2/Linux環境で動作するように設計されていますが、WSL–Windowsブリッジを介してWindowsワークスペースにもアクセス可能です。セットアップは簡単で、WSL内で仮想環境を作成し、依存関係をインストールして、対応するバリアントスクリプトを実行するだけです。Qubitzには、暗号化されたハーネスファイル(HARNESS.enc)とローカルキーファイルも含まれており、ランタイムルールの読み込みに使用されます。ハーネスファイルは通常の検索コンテキストから除外され、暗号化された複製が注入されるのを防ぎます。重要なオプションとして、--num-ctx、--num-predict、--max-steps、--thinking-effort(default、low、medium、high、xhigh)があり、GUIの右下にあるEffortセレクターも同じプリセットに対応しています。
全体として、Qubitzはローカルでプライバシーを重視するシナリオで優れた性能を発揮し、特に制御可能で予測可能な動作を必要とする小型モデルエージェントユーザーに適しています。クラウドの最先端モデルと生の知能で競うのではなく、自身のポジショニングにおいて実用的で信頼性の高いソリューションを提供します。プライバシーを重視し、有料サービスを使いたくない、ローカル制御とWSL/Windows操作を必要とするユーザーにとって、Qubitzは注目に値する選択肢です。