AI News HubLIVE
公开文章 10采集文章 21可信度 82刷新频率 120 分钟
健康状态 健康来源类型 官方原文权限 官方原文最近入库 2026-06-26ID qdrant-blog运行状态 已启用

Official vector database and AI infrastructure feed; confirm reuse terms before full body display.

最新公开文章

无需大语言模型的弱检索预测

大多数检索系统对所有查询使用单一管道,这种做法既不合适:单一管道对困难查询服务不足,对简单查询则浪费计算资源。本文提出了无需大语言模型的廉价信号——如分数分散和检索器一致性——来检测弱检索,从而实现仅在需要时进行选择性升级。

  • 弱检索发生在所需证据未出现在前k个结果中,即使更深层次召回率很高。
  • 廉价信号如稠密方差(分散度)、稠密与稀疏检索器的一致性以及最高分数,可预测弱检索,AUC最高达0.76。
站内正文

Qdrant中的TurboQuant

Qdrant 1.18推出了TurboQuant,一种基于Google Research的旋转向量量化方法,并进行了扩展以适用于生产级嵌入。它提供4位、2位、1.5位和1位的量化选项,在压缩率和召回率上优于或相当于标量量化(SQ)和二进制量化(BQ)。本文介绍了TurboQuant的原理、Qdrant的增强实现(长度归一化和各坐标校准)以及基准测试结果。

  • TurboQuant是一种新的旋转基向量量化算法,在4倍压缩下召回率与SQ相当,2位和1位模式下比BQ高出9-24个百分点。
  • Qdrant通过长度归一化和各坐标校准(各向异性补偿)增强了TurboQuant,使其适用于实际生产嵌入。
站内正文

针对电商搜索微调稀疏嵌入 | 第2部分:在Modal上训练SPLADE

本文是五部分系列的第二部分,介绍了如何在Modal的无服务器GPU上训练SPLADE模型,使用Amazon ESCI数据集进行电商搜索。文章涵盖了数据加载、产品文本格式化、Modal应用设置、SPLADE模型创建、训练函数、SpladeLoss理解、YAML配置、并行超参数搜索以及避免的陷阱。目标是构建一个针对电商搜索优化的稀疏嵌入模型。

  • 使用Amazon ESCI数据集,将精确匹配和替代品作为正样本训练SPLADE模型。
  • 产品文本格式化对稀疏嵌入至关重要,采用括号标注品牌、管道符分隔部分等方式保持词汇信号。
站内正文

微调稀疏嵌入用于电子商务搜索 | 第一部分:为什么稀疏嵌入优于 BM25

本文是系列文章的第一部分,探讨了在电子商务搜索中微调稀疏嵌入的优势。与密集嵌入相比,稀疏嵌入保留了精确匹配的关键细节,避免了语义模糊导致的不相关结果。文章介绍了SPLADE模型的工作原理、查询扩展能力以及Qdrant数据库对稀疏向量的原生支持。通过微调,该系统在Amazon ESCI数据集上实现了比BM25高出29%的性能提升。

  • 密集嵌入在电子商务中会模糊精确匹配,导致不相关搜索结果。
  • 稀疏嵌入通过大词汇空间保留每个词的重要性权重,实现精确匹配和可解释性。
站内正文

基于距离的数据探索

本文介绍如何利用Qdrant的距离矩阵API进行数据探索,包括降维、聚类和图表示等方法,帮助发现大规模非结构化数据中的隐藏结构。

  • Qdrant 1.12版推出的距离矩阵API简化了数据相似性分析,可高效计算距离矩阵。
  • 使用UMAP进行降维,将高维数据映射到2D空间以可视化整体结构。
站内正文

Qdrant 2024年夏季代码计划——Python中的ONNX交叉编码器

本文中,Huong (Celine) Hoang分享了她在Qdrant夏季代码计划期间将ONNX交叉编码器集成到FastEmbed库的经历。该项目通过相关性分数实现搜索结果重排序,增强了上下文感知搜索应用的能力。主要挑战包括构建新的输入输出方案、分词处理、模型加载与测试。该功能已在FastEmbed 0.4.0中可用。

  • 交叉编码器已集成到FastEmbed中,用于重排序任务。
  • 项目使用ONNX模型,避免PyTorch等重型依赖。
站内正文

什么是向量数据库?

本文介绍向量数据库的基本概念、与传统数据库的区别、核心组件(ID、维度、负载)、架构(集合、距离度量、存储)、主要功能(索引、搜索、更新、删除),以及密集向量与稀疏向量、混合搜索、量化、分布式部署、多租户和数据安全等高级特性。

  • 向量数据库将非结构化数据表示为高维向量,实现基于相似性的检索。
  • 核心组件包括唯一ID、数值维度和包含元数据的负载。
站内正文

什么是向量量化?

向量量化是一种用于压缩高维数据的技术,通过减少内存占用同时保留关键信息,实现更高效的存储和搜索。本文介绍了三种主要的量化方法:标量量化、二进制量化和乘积量化,并讨论了如何平衡精度、速度和压缩率。

  • 向量量化可显著降低内存使用并提升搜索速度,尤其适用于大规模数据集。
  • 标量量化将float32映射到int8,减少75%内存,是大多数应用的安全默认选择。
站内正文

Qdrant 1.7.0 正式发布!

Qdrant 1.7.0 引入了对稀疏向量的原生支持,实现了关键词搜索与语义搜索的混合检索;全新的 Discovery API 提供了更精确的向量搜索方式,包括发现搜索和上下文搜索;用户自定义分片功能允许灵活控制数据分布;基于快照的分片传输机制提升了集群扩展效率。此外,还包含多项性能优化和稳定性改进。

  • 原生支持稀疏向量,实现关键词与语义混合搜索
  • Discovery API 提供发现搜索和上下文搜索两种新模式
站内正文

关于非结构化数据、向量数据库、AI新时代以及我们的种子轮融资

Qdrant宣布完成750万美元种子轮融资,由Unusual Ventures领投。文章讨论向量数据库在AI时代的重要性,非结构化数据的爆炸式增长,以及Qdrant作为开源向量相似性搜索解决方案的进展和未来计划。

  • Qdrant获得750万美元种子轮融资,用于开发开源向量数据库。
  • 向量数据库是AI新栈的基础组件,用于处理非结构化数据。
站内正文

全部来源