ベクターデータベースをAIエージェントスタックから削除しました
Mossは、会話型AIエージェント向けの10ミリ秒未満のセマンティック検索ランタイムです。検索と埋め込みをプロセス内に組み込むことで、リモートのベクターデータベースを不要にし、クエリレイテンシを一桁ミリ秒に抑えます。ハイブリッド検索、組み込み埋め込み、メタデータフィルタリング、ブラウザ用のWebAssemblyビルドをサポート。ベンチマークでは、10万ドキュメントにおいてMossのP50レイテンシは3.1ミリ秒、Pineconeは432.6ミリ秒でした。
Mossは、会話型AIエージェント向けに設計された新しいセマンティック検索ランタイムです。その中核的な革新は、検索と埋め込みをアプリケーションプロセス内に直接組み込むことで、従来のベクターデータベースに伴うネットワーク遅延を排除したことです。これにより、開発者はクラスタの管理、HNSWパラメータの調整、シャーディングの心配をする必要がなくなり、ドキュメントをインデックス化してランタイムにロードし、クエリを実行するだけで済みます。
パフォーマンス面では、Mossは印象的な結果を示しています。10万ドキュメントのベンチマーク(Macbook Pro M4 Pro, 24GBメモリ使用)において、MossのP50クエリレイテンシはわずか3.1ミリ秒、P99は5.4ミリ秒でした。比較として、PineconeのP50は432.6ミリ秒、Qdrantは597.6ミリ秒、ChromaDBは351.8ミリ秒でした。これらの測定には埋め込み生成時間が含まれており、競合他社は外部の埋め込みサービスを使用しています。
Mossの機能セットは豊富です。ハイブリッド検索(セマンティック + キーワード)をサポートし、組み込みの埋め込みモデルを備えており、OpenAIキーは不要です。メタデータフィルタリング($eq、$and、$in、$near演算子)も可能で、WebAssembly SDKを使用すればブラウザ内で完全にクライアントサイドのセマンティック検索を実行することもできます。さらに、SQLite、MongoDB、MySQL、Supabaseからのデータ取り込みを可能にするデータベースコネクタも用意されています。
アーキテクチャは3つの部分から構成されます。Moss Cloudがドキュメントの取り込み、埋め込み、ストレージ、配布を処理します。Indexはドキュメントとそのベクトルを単一のアーティファクトとしてパッケージ化し、Moss Cloud上に存在します。Runtimeはアプリケーションに組み込まれ、HTTPS経由でインデックスをプルし、メモリに保持してローカルでクエリを処理します。インデックスがロードされると、クエリはプロセスを離れないため、10ミリ秒未満のレイテンシが実現されます。
MossはPython(3.10+)、TypeScript/Node.js(20+)、Elixir、C(libmoss)のSDKを提供しています。さらに、LangChain、DSPy、LlamaIndex、CrewAI、AutoGen、Haystack、Mastra、Pydantic AI、Pipecat、LiveKit、Vapi、ElevenLabsなどの主要なAIフレームワークとの統合もサポートしています。これらの統合により、開発者は既存のワークフローにMossを簡単に組み込むことができます。
さらに探求したい開発者のために、MossリポジトリにはPython、TypeScript、C、Goなどの言語による豊富なサンプルコードや、ボイスエージェント、フレームワーク統合などのユースケースが含まれています。また、Next.jsセマンティック検索UI、Pipecatボイスエージェント、Vapiボイスエージェントなどの完全なアプリケーション例も提供されています。
Mossはオープンソースで、BSD 2-Clauseライセンスの下で公開されています。Mossチームによって構築され、Y Combinatorの支援を受けています。リアルタイムのボイスボット、コパイロット、または人間と対話するAIエージェントを構築する開発者にとって、Mossは「生きている」と感じられる検索体験を提供し、ラグを感じさせるツールとは一線を画します。