无需大语言模型的弱检索预测
大多数检索系统对所有查询使用单一管道,这种做法既不合适:单一管道对困难查询服务不足,对简单查询则浪费计算资源。本文提出了无需大语言模型的廉价信号——如分数分散和检索器一致性——来检测弱检索,从而实现仅在需要时进行选择性升级。
- 弱检索发生在所需证据未出现在前k个结果中,即使更深层次召回率很高。
- 廉价信号如稠密方差(分散度)、稠密与稀疏检索器的一致性以及最高分数,可预测弱检索,AUC最高达0.76。
Official vector database and AI infrastructure feed; confirm reuse terms before full body display.
大多数检索系统对所有查询使用单一管道,这种做法既不合适:单一管道对困难查询服务不足,对简单查询则浪费计算资源。本文提出了无需大语言模型的廉价信号——如分数分散和检索器一致性——来检测弱检索,从而实现仅在需要时进行选择性升级。
Qdrant 1.18推出了TurboQuant,一种基于Google Research的旋转向量量化方法,并进行了扩展以适用于生产级嵌入。它提供4位、2位、1.5位和1位的量化选项,在压缩率和召回率上优于或相当于标量量化(SQ)和二进制量化(BQ)。本文介绍了TurboQuant的原理、Qdrant的增强实现(长度归一化和各坐标校准)以及基准测试结果。
本文是五部分系列的第二部分,介绍了如何在Modal的无服务器GPU上训练SPLADE模型,使用Amazon ESCI数据集进行电商搜索。文章涵盖了数据加载、产品文本格式化、Modal应用设置、SPLADE模型创建、训练函数、SpladeLoss理解、YAML配置、并行超参数搜索以及避免的陷阱。目标是构建一个针对电商搜索优化的稀疏嵌入模型。
本文是系列文章的第一部分,探讨了在电子商务搜索中微调稀疏嵌入的优势。与密集嵌入相比,稀疏嵌入保留了精确匹配的关键细节,避免了语义模糊导致的不相关结果。文章介绍了SPLADE模型的工作原理、查询扩展能力以及Qdrant数据库对稀疏向量的原生支持。通过微调,该系统在Amazon ESCI数据集上实现了比BM25高出29%的性能提升。
本文介绍如何利用Qdrant的距离矩阵API进行数据探索,包括降维、聚类和图表示等方法,帮助发现大规模非结构化数据中的隐藏结构。
本文中,Huong (Celine) Hoang分享了她在Qdrant夏季代码计划期间将ONNX交叉编码器集成到FastEmbed库的经历。该项目通过相关性分数实现搜索结果重排序,增强了上下文感知搜索应用的能力。主要挑战包括构建新的输入输出方案、分词处理、模型加载与测试。该功能已在FastEmbed 0.4.0中可用。
本文介绍向量数据库的基本概念、与传统数据库的区别、核心组件(ID、维度、负载)、架构(集合、距离度量、存储)、主要功能(索引、搜索、更新、删除),以及密集向量与稀疏向量、混合搜索、量化、分布式部署、多租户和数据安全等高级特性。
向量量化是一种用于压缩高维数据的技术,通过减少内存占用同时保留关键信息,实现更高效的存储和搜索。本文介绍了三种主要的量化方法:标量量化、二进制量化和乘积量化,并讨论了如何平衡精度、速度和压缩率。
Qdrant 1.7.0 引入了对稀疏向量的原生支持,实现了关键词搜索与语义搜索的混合检索;全新的 Discovery API 提供了更精确的向量搜索方式,包括发现搜索和上下文搜索;用户自定义分片功能允许灵活控制数据分布;基于快照的分片传输机制提升了集群扩展效率。此外,还包含多项性能优化和稳定性改进。
Qdrant宣布完成750万美元种子轮融资,由Unusual Ventures领投。文章讨论向量数据库在AI时代的重要性,非结构化数据的爆炸式增长,以及Qdrant作为开源向量相似性搜索解决方案的进展和未来计划。