AI News HubLIVE
站內改寫2 分鐘閱讀

Qdrant 1.7.0 正式發佈!

Qdrant 1.7.0 引入了對稀疏向量的原生支持,實現了關鍵詞搜索與語義搜索的混合檢索;全新的 Discovery API 提供了更精確的向量搜索方式,包括髮現搜索和上下文搜索;用户自定義分片功能允許靈活控制數據分佈;基於快照的分片傳輸機制提升了集羣擴展效率。此外,還包含多項性能優化和穩定性改進。

來源Qdrant Blog作者: [email protected] (Andrey Vasnetsov)

經過漫長的等待,Qdrant 1.7.0 版本終於正式發佈。除了若干小修復和改進外,本次更新帶來了一系列令人興奮的全新功能。

最受期待的特性莫過於對稀疏向量的原生支持。此前,Qdrant 僅支持稠密向量,用户若需關鍵詞搜索(如 TF-IDF、BM25)則需藉助其他工具。稀疏向量雖然在理論維度上遠高於稠密向量,但因其大多數維度為零,存儲時僅保留非零維度,因此高效且適合關鍵詞匹配。現在,用户可以在單一平台中同時使用稠密向量和稀疏向量,構建混合搜索系統,兼顧語義理解與精確匹配。

Discover API 的推出進一步拓展了向量的應用場景。該 API 與推薦 API 界面相似,但專注於通過“上下文”概念精化搜索參數。上下文由正負樣本對組成,這些樣本對將向量空間劃分為積極區域和消極區域。搜索時,算法優先考慮位於積極區域內的點,或避開消極區域。Discover API 支持兩種模式:發現搜索(需指定目標點)和上下文搜索(無需目標點,僅依靠上下文在 HNSW 圖中探索,結果更富多樣性)。

用户自定義分片功能賦予用户對數據分佈的細粒度控制。以往,Qdrant 通過一致性哈希自動將點分配到分片。現在,用户可在創建集合時定義分片,並在 upsert 操作中為每個點指定分片鍵(shard_key)。搜索時也可通過 shard_key 參數僅查詢特定分片,適用於需將相同用户數據存儲在同一分片或使用專用節點的場景。

基於快照的分片傳輸是分佈式模式下的一大技術改進。傳統的流式傳輸方法(stream_records)需在目標節點重建 HNSW 索引。新方法則直接傳輸包含完整索引的快照,目標節點加載後即可立即處理請求,無需重建索引,顯著提升集羣動態擴展時的性能。

此外,1.7.0 版本還包含多項性能優化:改進高 CPU 系統下的 HNSW 索引構建、降低搜索尾延遲、為地理地圖負載添加索引、提升大負載集羣的共識穩定性,以及可配置的搜索超時等。

Qdrant 1.7.0 在開源社區的支持下持續進化,歡迎加入 Discord 社區貢獻反饋。詳細的發佈説明可在官方文檔中查閲。