AI News HubLIVE
站內改寫2 分鐘閱讀

Qdrant 1.7.0 正式釋出!

Qdrant 1.7.0 引入了對稀疏向量的原生支援,實現了關鍵詞搜尋與語義搜尋的混合檢索;全新的 Discovery API 提供了更精確的向量搜尋方式,包括髮現搜尋和上下文搜尋;使用者自定義分片功能允許靈活控制資料分佈;基於快照的分片傳輸機制提升了叢集擴充套件效率。此外,還包含多項效能最佳化和穩定性改進。

來源Qdrant Blog作者: [email protected] (Andrey Vasnetsov)

經過漫長的等待,Qdrant 1.7.0 版本終於正式釋出。除了若干小修復和改進外,本次更新帶來了一系列令人興奮的全新功能。

最受期待的特性莫過於對稀疏向量的原生支援。此前,Qdrant 僅支援稠密向量,使用者若需關鍵詞搜尋(如 TF-IDF、BM25)則需藉助其他工具。稀疏向量雖然在理論維度上遠高於稠密向量,但因其大多數維度為零,儲存時僅保留非零維度,因此高效且適合關鍵詞匹配。現在,使用者可以在單一平臺中同時使用稠密向量和稀疏向量,構建混合搜尋系統,兼顧語義理解與精確匹配。

Discover API 的推出進一步拓展了向量的應用場景。該 API 與推薦 API 介面相似,但專注於透過“上下文”概念精化搜尋引數。上下文由正負樣本對組成,這些樣本對將向量空間劃分為積極區域和消極區域。搜尋時,演算法優先考慮位於積極區域內的點,或避開消極區域。Discover API 支援兩種模式:發現搜尋(需指定目標點)和上下文搜尋(無需目標點,僅依靠上下文在 HNSW 圖中探索,結果更富多樣性)。

使用者自定義分片功能賦予使用者對資料分佈的細粒度控制。以往,Qdrant 透過一致性雜湊自動將點分配到分片。現在,使用者可在建立集合時定義分片,並在 upsert 操作中為每個點指定分片鍵(shard_key)。搜尋時也可透過 shard_key 引數僅查詢特定分片,適用於需將相同使用者資料儲存在同一分片或使用專用節點的場景。

基於快照的分片傳輸是分散式模式下的一大技術改進。傳統的流式傳輸方法(stream_records)需在目標節點重建 HNSW 索引。新方法則直接傳輸包含完整索引的快照,目標節點載入後即可立即處理請求,無需重建索引,顯著提升叢集動態擴充套件時的效能。

此外,1.7.0 版本還包含多項效能最佳化:改進高 CPU 系統下的 HNSW 索引構建、降低搜尋尾延遲、為地理地圖負載新增索引、提升大負載叢集的共識穩定性,以及可配置的搜尋超時等。

Qdrant 1.7.0 在開源社群的支援下持續進化,歡迎加入 Discord 社群貢獻反饋。詳細的釋出說明可在官方文件中查閱。