非構造化データ、ベクターデータベース、新しいAI時代、そして私たちのシードラウンドについて
Qdrantは750万ドルのシードラウンドを発表。Unusual Venturesがリードしました。この記事では、AI時代におけるベクターデータベースの重要性、非構造化データの爆発的増加、そしてQdrantのオープンソースベクター類似性検索ソリューションとしての進捗と将来計画について述べています。
Qdrantは、750万ドルのシードラウンドを完了したことを発表しました。このラウンドはUnusual Venturesがリードし、複数のエンジェル投資家と既存投資家が参加しました。調達した資金は、最先端のオープンソースベクター類似性検索ソリューションの開発に充てられ、エンジニアが非構造化データと大規模言語モデル(LLM)の力を最大限に活用できるよう支援します。
非構造化データは指数関数的に増加しています。2025年までにグローバルデータ圏は165ゼタバイトに達し、その約80%が非構造化データになると予測されています。同時に、AIへの需要の高まりは既存のインフラを大幅に上回っており、機械学習研究の約90%は適切なツール不足により本番環境に至っていません。ベクターデータベースは、ニューラルネットワークモデルから得られるベクター埋め込みを通じてオブジェクトを表現し、高次元データの保存、管理、検索を可能にします。セマンティック検索、マッチングエンジン、レコメンダーシステムから異常検知、時系列データ、バイオメディカルデータまで、さまざまなユースケースをサポートします。
大規模言語モデルの台頭により、ベクターデータベースは新しいAIスタックの基礎的構成要素となりました。ChatGPTなどのLLMベースアプリケーションの知識ベースを拡張し、リアルタイムデータを統合することで、さらに高度なアプリケーションを構築することが可能になります。Qdrantは、従来のベクター検索ライブラリ(FAISSなど)が持つ欠点——アプリケーションコードとの密結合、CRUD操作や高度なフィルタリングといった本番環境向け機能の欠如、スケーリングの難しさ——を解消すべく取り組んでいます。
Qdrantのエコシステムは、Qdrant Cloudとエンタープライズ向けオンプレミスソリューションで構成されています。Qdrant Cloudは年初にローンチし、すでに1000以上のクラスターを運用中です。技術面では、Rust言語を採用し、カスタマイズされたHNSWアルゴリズムにより、高性能な近似最近傍探索を実現。最近リリースされたスカラー量子化により、メモリ使用量を4分の1に削減し、速度を2倍に向上。今後は製品量子化を導入し、さらなるメモリ節約を図ります。
Qdrantはコミュニティの貢献とサポートに感謝しており、シードラウンドの成功は彼らなしでは実現できなかったと述べています。また、投資家に対しては、華やかなピッチデックではなく、コミュニティの活動と製品フィードバックに注目するようアドバイスしています。