Qdrant Blog AI 新聞來源

公開文章 10採集文章 21可信度 82刷新頻率 120 分鐘

健康狀態健康來源類型官方原文權限 官方原文最近入庫 2026-06-26ID qdrant-blog運行狀態 已啟用

Official vector database and AI infrastructure feed; confirm reuse terms before full body display.

最新公開文章

無需大語言模型的弱檢索預測

2026-06-24 05:00 UTC+8

大多數檢索系統對所有查詢使用單一管道，這種做法既不合適：單一管道對困難查詢服務不足，對簡單查詢則浪費計算資源。本文提出了無需大語言模型的廉價訊號——如分數分散和檢索器一致性——來檢測弱檢索，從而實現僅在需要時進行選擇性升級。

弱檢索發生在所需證據未出現在前k個結果中，即使更深層次召回率很高。
廉價訊號如稠密方差（分散度）、稠密與稀疏檢索器的一致性以及最高分數，可預測弱檢索，AUC最高達0.76。

Qdrant中的TurboQuant

2026-05-13 16:00 UTC+8

Qdrant 1.18推出了TurboQuant，一種基於Google Research的旋轉向量量化方法，並進行了擴充套件以適用於生產級嵌入。它提供4位、2位、1.5位和1位的量化選項，在壓縮率和召回率上優於或相當於標量量化(SQ)和二進位制量化(BQ)。本文介紹了TurboQuant的原理、Qdrant的增強實現（長度歸一化和各座標校準）以及基準測試結果。

TurboQuant是一種新的旋轉基向量量化演算法，在4倍壓縮下召回率與SQ相當，2位和1位模式下比BQ高出9-24個百分點。
Qdrant透過長度歸一化和各座標校準（各向異性補償）增強了TurboQuant，使其適用於實際生產嵌入。

針對電商搜尋微調稀疏嵌入 | 第2部分：在Modal上訓練SPLADE

2026-03-09 08:00 UTC+8

本文是五部分系列的第二部分，介紹瞭如何在Modal的無伺服器GPU上訓練SPLADE模型，使用Amazon ESCI資料集進行電商搜尋。文章涵蓋了資料載入、產品文本格式化、Modal應用設定、SPLADE模型建立、訓練函式、SpladeLoss理解、YAML配置、並行超引數搜尋以及避免的陷阱。目標是構建一個針對電商搜尋最佳化的稀疏嵌入模型。

使用Amazon ESCI資料集，將精確匹配和替代品作為正樣本訓練SPLADE模型。
產品文本格式化對稀疏嵌入至關重要，採用括號標註品牌、管道符分隔部分等方式保持詞彙訊號。

微調稀疏嵌入用於電子商務搜尋 | 第一部分：為什麼稀疏嵌入優於 BM25

2026-03-09 08:00 UTC+8

本文是系列文章的第一部分，探討了在電子商務搜尋中微調稀疏嵌入的優勢。與密集嵌入相比，稀疏嵌入保留了精確匹配的關鍵細節，避免了語義模糊導致的不相關結果。文章介紹了SPLADE模型的工作原理、查詢擴充套件能力以及Qdrant資料庫對稀疏向量的原生支援。透過微調，該系統在Amazon ESCI資料集上實現了比BM25高出29%的效能提升。

密集嵌入在電子商務中會模糊精確匹配，導致不相關搜尋結果。
稀疏嵌入透過大詞彙空間保留每個詞的重要性權重，實現精確匹配和可解釋性。

基於距離的資料探索

2025-03-11 17:00 UTC+8

本文介紹如何利用Qdrant的距離矩陣API進行資料探索，包括降維、聚類和圖表示等方法，幫助發現大規模非結構化資料中的隱藏結構。

Qdrant 1.12版推出的距離矩陣API簡化了資料相似性分析，可高效計算距離矩陣。
使用UMAP進行降維，將高維資料對映到2D空間以視覺化整體結構。

Qdrant 2024年夏季程式碼計劃——Python中的ONNX交叉編碼器

2024-10-14 13:00 UTC+8

本文中，Huong (Celine) Hoang分享了她在Qdrant夏季程式碼計劃期間將ONNX交叉編碼器整合到FastEmbed庫的經歷。該專案透過相關性分數實現搜尋結果重排序，增強了上下文感知搜尋應用的能力。主要挑戰包括構建新的輸入輸出方案、分詞處理、模型載入與測試。該功能已在FastEmbed 0.4.0中可用。

交叉編碼器已整合到FastEmbed中，用於重排序任務。
專案使用ONNX模型，避免PyTorch等重型依賴。

什麼是向量資料庫？

2024-10-09 20:29 UTC+8

本文介紹向量資料庫的基本概念、與傳統資料庫的區別、核心元件（ID、維度、負載）、架構（集合、距離度量、儲存）、主要功能（索引、搜尋、更新、刪除），以及密集向量與稀疏向量、混合搜尋、量化、分散式部署、多租戶和資料安全等高階特性。

向量資料庫將非結構化資料表示為高維向量，實現基於相似性的檢索。
核心元件包括唯一ID、數值維度和包含後設資料的負載。

什麼是向量量化？

2024-09-25 20:29 UTC+8

向量量化是一種用於壓縮高維資料的技術，透過減少記憶體佔用同時保留關鍵資訊，實現更高效的儲存和搜尋。本文介紹了三種主要的量化方法：標量量化、二進位制量化和乘積量化，並討論瞭如何平衡精度、速度和壓縮率。

向量量化可顯著降低記憶體使用並提升搜尋速度，尤其適用於大規模資料集。
標量量化將float32對映到int8，減少75%記憶體，是大多數應用的安全預設選擇。

Qdrant 1.7.0 正式釋出！

2023-12-10 18:00 UTC+8

Qdrant 1.7.0 引入了對稀疏向量的原生支援，實現了關鍵詞搜尋與語義搜尋的混合檢索；全新的 Discovery API 提供了更精確的向量搜尋方式，包括髮現搜尋和上下文搜尋；使用者自定義分片功能允許靈活控制資料分佈；基於快照的分片傳輸機制提升了叢集擴充套件效率。此外，還包含多項效能最佳化和穩定性改進。

原生支援稀疏向量，實現關鍵詞與語義混合搜尋
Discovery API 提供發現搜尋和上下文搜尋兩種新模式

關於非結構化資料、向量資料庫、AI新時代以及我們的種子輪融資

2023-04-19 08:42 UTC+8

Qdrant宣佈完成750萬美元種子輪融資，由Unusual Ventures領投。文章討論向量資料庫在AI時代的重要性，非結構化資料的爆炸式增長，以及Qdrant作為開源向量相似性搜尋解決方案的進展和未來計劃。

Qdrant獲得750萬美元種子輪融資，用於開發開源向量資料庫。
向量資料庫是AI新棧的基礎元件，用於處理非結構化資料。

Qdrant Blog