AI News HubLIVE
公開文章 10採集文章 21可信度 82刷新頻率 120 分鐘
健康狀態 健康來源類型 官方原文權限 官方原文最近入庫 2026-06-26ID qdrant-blog運行狀態 已啟用

Official vector database and AI infrastructure feed; confirm reuse terms before full body display.

最新公開文章

無需大語言模型的弱檢索預測

大多數檢索系統對所有查詢使用單一管道,這種做法既不合適:單一管道對困難查詢服務不足,對簡單查詢則浪費計算資源。本文提出了無需大語言模型的廉價信號——如分數分散和檢索器一致性——來檢測弱檢索,從而實現僅在需要時進行選擇性升級。

  • 弱檢索發生在所需證據未出現在前k個結果中,即使更深層次召回率很高。
  • 廉價信號如稠密方差(分散度)、稠密與稀疏檢索器的一致性以及最高分數,可預測弱檢索,AUC最高達0.76。
站內正文

Qdrant中的TurboQuant

Qdrant 1.18推出了TurboQuant,一種基於Google Research的旋轉向量量化方法,並進行了擴展以適用於生產級嵌入。它提供4位、2位、1.5位和1位的量化選項,在壓縮率和召回率上優於或相當於標量量化(SQ)和二進制量化(BQ)。本文介紹了TurboQuant的原理、Qdrant的增強實現(長度歸一化和各座標校準)以及基準測試結果。

  • TurboQuant是一種新的旋轉基向量量化算法,在4倍壓縮下召回率與SQ相當,2位和1位模式下比BQ高出9-24個百分點。
  • Qdrant通過長度歸一化和各座標校準(各向異性補償)增強了TurboQuant,使其適用於實際生產嵌入。
站內正文

針對電商搜索微調稀疏嵌入 | 第2部分:在Modal上訓練SPLADE

本文是五部分系列的第二部分,介紹瞭如何在Modal的無服務器GPU上訓練SPLADE模型,使用Amazon ESCI數據集進行電商搜索。文章涵蓋了數據加載、產品文本格式化、Modal應用設置、SPLADE模型創建、訓練函數、SpladeLoss理解、YAML配置、並行超參數搜索以及避免的陷阱。目標是構建一個針對電商搜索優化的稀疏嵌入模型。

  • 使用Amazon ESCI數據集,將精確匹配和替代品作為正樣本訓練SPLADE模型。
  • 產品文本格式化對稀疏嵌入至關重要,採用括號標註品牌、管道符分隔部分等方式保持詞彙信號。
站內正文

微調稀疏嵌入用於電子商務搜索 | 第一部分:為什麼稀疏嵌入優於 BM25

本文是系列文章的第一部分,探討了在電子商務搜索中微調稀疏嵌入的優勢。與密集嵌入相比,稀疏嵌入保留了精確匹配的關鍵細節,避免了語義模糊導致的不相關結果。文章介紹了SPLADE模型的工作原理、查詢擴展能力以及Qdrant數據庫對稀疏向量的原生支持。通過微調,該系統在Amazon ESCI數據集上實現了比BM25高出29%的性能提升。

  • 密集嵌入在電子商務中會模糊精確匹配,導致不相關搜索結果。
  • 稀疏嵌入通過大詞彙空間保留每個詞的重要性權重,實現精確匹配和可解釋性。
站內正文

基於距離的數據探索

本文介紹如何利用Qdrant的距離矩陣API進行數據探索,包括降維、聚類和圖表示等方法,幫助發現大規模非結構化數據中的隱藏結構。

  • Qdrant 1.12版推出的距離矩陣API簡化了數據相似性分析,可高效計算距離矩陣。
  • 使用UMAP進行降維,將高維數據映射到2D空間以可視化整體結構。
站內正文

Qdrant 2024年夏季代碼計劃——Python中的ONNX交叉編碼器

本文中,Huong (Celine) Hoang分享了她在Qdrant夏季代碼計劃期間將ONNX交叉編碼器集成到FastEmbed庫的經歷。該項目通過相關性分數實現搜索結果重排序,增強了上下文感知搜索應用的能力。主要挑戰包括構建新的輸入輸出方案、分詞處理、模型加載與測試。該功能已在FastEmbed 0.4.0中可用。

  • 交叉編碼器已集成到FastEmbed中,用於重排序任務。
  • 項目使用ONNX模型,避免PyTorch等重型依賴。
站內正文

什麼是向量數據庫?

本文介紹向量數據庫的基本概念、與傳統數據庫的區別、核心組件(ID、維度、負載)、架構(集合、距離度量、存儲)、主要功能(索引、搜索、更新、刪除),以及密集向量與稀疏向量、混合搜索、量化、分佈式部署、多租户和數據安全等高級特性。

  • 向量數據庫將非結構化數據表示為高維向量,實現基於相似性的檢索。
  • 核心組件包括唯一ID、數值維度和包含元數據的負載。
站內正文

什麼是向量量化?

向量量化是一種用於壓縮高維數據的技術,通過減少內存佔用同時保留關鍵信息,實現更高效的存儲和搜索。本文介紹了三種主要的量化方法:標量量化、二進制量化和乘積量化,並討論瞭如何平衡精度、速度和壓縮率。

  • 向量量化可顯著降低內存使用並提升搜索速度,尤其適用於大規模數據集。
  • 標量量化將float32映射到int8,減少75%內存,是大多數應用的安全默認選擇。
站內正文

Qdrant 1.7.0 正式發佈!

Qdrant 1.7.0 引入了對稀疏向量的原生支持,實現了關鍵詞搜索與語義搜索的混合檢索;全新的 Discovery API 提供了更精確的向量搜索方式,包括髮現搜索和上下文搜索;用户自定義分片功能允許靈活控制數據分佈;基於快照的分片傳輸機制提升了集羣擴展效率。此外,還包含多項性能優化和穩定性改進。

  • 原生支持稀疏向量,實現關鍵詞與語義混合搜索
  • Discovery API 提供發現搜索和上下文搜索兩種新模式
站內正文

關於非結構化數據、向量數據庫、AI新時代以及我們的種子輪融資

Qdrant宣佈完成750萬美元種子輪融資,由Unusual Ventures領投。文章討論向量數據庫在AI時代的重要性,非結構化數據的爆炸式增長,以及Qdrant作為開源向量相似性搜索解決方案的進展和未來計劃。

  • Qdrant獲得750萬美元種子輪融資,用於開發開源向量數據庫。
  • 向量數據庫是AI新棧的基礎組件,用於處理非結構化數據。
站內正文

全部來源