2023-12-10 18:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

Qdrant 1.7.0 正式釋出！

Qdrant 1.7.0 引入了對稀疏向量的原生支援，實現了關鍵詞搜尋與語義搜尋的混合檢索；全新的 Discovery API 提供了更精確的向量搜尋方式，包括髮現搜尋和上下文搜尋；使用者自定義分片功能允許靈活控制資料分佈；基於快照的分片傳輸機制提升了叢集擴充套件效率。此外，還包含多項效能最佳化和穩定性改進。

來源Qdrant Blog作者: [email protected] (Andrey Vasnetsov)

經過漫長的等待，Qdrant 1.7.0 版本終於正式釋出。除了若干小修復和改進外，本次更新帶來了一系列令人興奮的全新功能。

最受期待的特性莫過於對稀疏向量的原生支援。此前，Qdrant 僅支援稠密向量，使用者若需關鍵詞搜尋（如 TF-IDF、BM25）則需藉助其他工具。稀疏向量雖然在理論維度上遠高於稠密向量，但因其大多數維度為零，儲存時僅保留非零維度，因此高效且適合關鍵詞匹配。現在，使用者可以在單一平臺中同時使用稠密向量和稀疏向量，構建混合搜尋系統，兼顧語義理解與精確匹配。

Discover API 的推出進一步拓展了向量的應用場景。該 API 與推薦 API 介面相似，但專注於透過“上下文”概念精化搜尋引數。上下文由正負樣本對組成，這些樣本對將向量空間劃分為積極區域和消極區域。搜尋時，演算法優先考慮位於積極區域內的點，或避開消極區域。Discover API 支援兩種模式：發現搜尋（需指定目標點）和上下文搜尋（無需目標點，僅依靠上下文在 HNSW 圖中探索，結果更富多樣性）。

使用者自定義分片功能賦予使用者對資料分佈的細粒度控制。以往，Qdrant 透過一致性雜湊自動將點分配到分片。現在，使用者可在建立集合時定義分片，並在 upsert 操作中為每個點指定分片鍵（shard_key）。搜尋時也可透過 shard_key 引數僅查詢特定分片，適用於需將相同使用者資料儲存在同一分片或使用專用節點的場景。

基於快照的分片傳輸是分散式模式下的一大技術改進。傳統的流式傳輸方法（stream_records）需在目標節點重建 HNSW 索引。新方法則直接傳輸包含完整索引的快照，目標節點載入後即可立即處理請求，無需重建索引，顯著提升叢集動態擴充套件時的效能。

此外，1.7.0 版本還包含多項效能最佳化：改進高 CPU 系統下的 HNSW 索引構建、降低搜尋尾延遲、為地理地圖負載新增索引、提升大負載叢集的共識穩定性，以及可配置的搜尋超時等。

Qdrant 1.7.0 在開源社群的支援下持續進化，歡迎加入 Discord 社群貢獻反饋。詳細的釋出說明可在官方文件中查閱。