LocalVibe – 純Rust製ローカルAIスタック、MCP対応、単一バイナリ(Apple Silicon)
LocalVibeは、Apple Silicon向けに最適化された純Rust製のローカルAIコーディングアシスタントです。Metalを介した量子化LLMとのチャット、オンデバイスONNX埋め込み、LanceDBベクトル検索、TUIインターフェースを提供します。Claude Code用のMCPサーバー、OpenAI互換HTTPサーバー、さまざまなツール統合を含みます。
記事インテリジェンス
要点
- 純Rustバイナリ、Candle+Metal推論、fastembed-rs埋め込み、LanceDBベクトルストア。
- チャット、モデル、データベース、インデックス、設定の5セクションを持つTUI。
- Claude Code用MCPサーバーとOpenAI互換HTTPサーバーをサポート。
- GGUFモデルと複数の埋め込みバックエンドを設定可能で、llama.cppとの併用も可能。
重要な理由
このニュースが重要なのは、純Rustバイナリ、Candle+Metal推論、fastembed-rs埋め込み、LanceDBベクトルストアためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
LocalVibeは、Apple Silicon(M1-M4)向けに最適化された純Rust製のローカルAIコーディングアシスタントです。量子化LLMとのチャット、オンデバイスONNX埋め込み、LanceDBベクトル検索を単一のバイナリに統合し、ratatui TUIを介してインタラクティブな操作を提供します。このプロジェクトは、完全にローカルで依存関係のないAI支援コーディングツールを目指しており、MCP(Model Context Protocol)およびOpenAI互換のHTTPサーバーをサポートしています。
インストールは簡単で、リポジトリをクローンしてCargoでインストールするだけです。ユーザーはGGUF形式のチャットモデル(例:Qwen2.5-7B-Instruct)をダウンロードし、設定ファイルでモデルパスを指定する必要があります。初回のTUI起動時には、4.4GBのモデルファイルのロードに約5秒、埋め込みモデルの初回実行時にはONNX重みのダウンロードに約10秒かかります。
LocalVibeのアーキテクチャは明確で、複数のクレートから構成されています。lv-cliがメインバイナリでディスパッチャーとして機能し、lv-tuiがUIを担当、lv-inferenceが推論を管理、lv-ragが検索拡張生成を担当します。主要な機能は3つの交換可能なトレイトペアです。InferenceBackend(Candle/MetalとPythonフォールバックをサポート)、EmbeddingBackend(fastembedとMLXフォールバックをサポート)、AppHost(循環依存を避けるための限定的な機能インターフェース)です。
TUIインターフェースはチャット、モデル、データベース、インデックス、設定の5つのセクションに分かれています。F1-F5またはCtrl+1-5で素早く切り替えられます。チャット画面は2カラムレイアウトで、左側に会話と入力、右側に検索されたコンテキストブロックが表示されます。モデル管理ページでは、モデルの読み込み、アンロード、切り替えが可能です。データベースページでは複数のベクトルストアを管理します。インデックス機能は、ディレクトリ内のファイルを解析、チャンク分割、埋め込みしてデータベースに追加します。設定ページにはバージョンや設定パスなどの読み取り専用情報が表示されます。
LocalVibeは、標準入出力を介してMCPサーバーとしても機能し、Claude CodeなどのMCPクライアントからローカルインデックスを呼び出せます。公開されるツールはsearch_code、index_directory、get_stats、list_sources、get_statusの5つです。また、OpenAI互換のHTTPサーバーも提供し、ストリーミングおよび非ストリーミングのチャット補完とツール使用をサポートします。Candleでサポートされていないアーキテクチャ(Qwen 3.5ハイブリッドSSMなど)については、llama.cppのllama-serverと併用することを推奨しています。