AI News HubLIVE
サイト内リライト2 分で読了

Show HN: wavecat – 画面を監視する完全ローカルの個人エージェント

wavecat は、画面を監視してアクティビティを理解する完全ローカルの AI エージェントです。すべての処理はデバイス上で行われ、プライバシーが確保されます。ローカルのビジョンと言語モデル(約19GBのディスク容量)を使用し、強力なGPUまたはユニファイドメモリ(24GB以上のRAM推奨)が必要です。macOS Apple Silicon、Windows、Linux(Vulkan/CUDA)に対応。現在は英語のみ対応で、今後の統合とSDKが計画されています。

ソースHacker News AI著者: sdkpanda

wavecat は Samuel Yuan によって開発された完全ローカルの個人 AI エージェントで、画面を常時監視してユーザーのアクティビティを理解します。クラウドベースのAIサービスとは異なり、wavecatのすべてのモデルはローカルデバイス上で動作するため、個人データがデバイス外に出ることはなく、プライバシーとデータ主権が確保されます。このプロジェクトは、ユーザーがデータ漏洩やネットワーク接続を心配することなく使用できる、ローカルな個人AIの未来を目指しています。

wavecatの使用は非常に簡単です。インストール後、ビジョンモデルと言語モデルのインストールプロセスがガイドされます。これらのモデルは大量の量子化を経ても約19GBのディスク容量を必要とし、数十億のパラメータを含んでいます。また、wavecatに画面表示を許可することで、ユーザーの活動や目標を深く理解し、必要が生じる前に先回りして支援できるようになります。すべてのデータはローカルに保存され、処理もローカルで行われるため、インターネットをオフにしても問題なく動作します。

ハードウェア要件としては、Macユーザーは最低24GBのユニファイドメモリ(推奨32GB以上)が必要で、Apple Silicon搭載のMacのみに対応しています。WindowsおよびLinuxユーザーは、Vulkan対応またはCUDA対応の専用GPU(最低12GB VRAM)または24GB以上のユニファイドメモリデバイスが推奨されます。これらの要件は強制されませんが、満たさない場合快適に使用できません。著者は、モデルの改善やハードウェアの進歩、推論システムの最適化により、将来的にはより安価なハードウェアでも動作するようになることを期待しています。

技術的には、wavecat は llama.cpp を主要なバックエンド推論エンジンとして使用し、主要言語モデルとして Qwen3.6 35B A3B を採用しています。より強力なオープンソースモデルをバックエンドとして接続するためのSDKが github.com/sdkyuanpanda/wavecat-sdk で開発中です。48GB RAM の M5 Pro では、タスクに応じて約70~90 tok/s で快適に動作し、今後のアップデートでより良い投機的デコード手法やMLXサポートが導入され、さらに高速化が期待されます。

現在 wavecat は英語のみサポートしており、他の言語での対話は性能が低下する可能性があります。アプリケーションやツールとの統合は開発中で、SDKも大幅に改善される予定です。質問やフィードバックはFAQを参照するか、著者 ([email protected]) にメールで連絡できます。