Qdrant Blog AI 新闻来源

公开文章 10采集文章 21可信度 82刷新频率 120 分钟

健康状态健康来源类型官方原文权限 官方原文最近入库 2026-06-26ID qdrant-blog运行状态 已启用

Official vector database and AI infrastructure feed; confirm reuse terms before full body display.

最新公开文章

无需大语言模型的弱检索预测

2026-06-24 05:00 UTC+8

大多数检索系统对所有查询使用单一管道，这种做法既不合适：单一管道对困难查询服务不足，对简单查询则浪费计算资源。本文提出了无需大语言模型的廉价信号——如分数分散和检索器一致性——来检测弱检索，从而实现仅在需要时进行选择性升级。

弱检索发生在所需证据未出现在前k个结果中，即使更深层次召回率很高。
廉价信号如稠密方差（分散度）、稠密与稀疏检索器的一致性以及最高分数，可预测弱检索，AUC最高达0.76。

Qdrant中的TurboQuant

2026-05-13 16:00 UTC+8

Qdrant 1.18推出了TurboQuant，一种基于Google Research的旋转向量量化方法，并进行了扩展以适用于生产级嵌入。它提供4位、2位、1.5位和1位的量化选项，在压缩率和召回率上优于或相当于标量量化(SQ)和二进制量化(BQ)。本文介绍了TurboQuant的原理、Qdrant的增强实现（长度归一化和各坐标校准）以及基准测试结果。

TurboQuant是一种新的旋转基向量量化算法，在4倍压缩下召回率与SQ相当，2位和1位模式下比BQ高出9-24个百分点。
Qdrant通过长度归一化和各坐标校准（各向异性补偿）增强了TurboQuant，使其适用于实际生产嵌入。

针对电商搜索微调稀疏嵌入 | 第2部分：在Modal上训练SPLADE

2026-03-09 08:00 UTC+8

本文是五部分系列的第二部分，介绍了如何在Modal的无服务器GPU上训练SPLADE模型，使用Amazon ESCI数据集进行电商搜索。文章涵盖了数据加载、产品文本格式化、Modal应用设置、SPLADE模型创建、训练函数、SpladeLoss理解、YAML配置、并行超参数搜索以及避免的陷阱。目标是构建一个针对电商搜索优化的稀疏嵌入模型。

使用Amazon ESCI数据集，将精确匹配和替代品作为正样本训练SPLADE模型。
产品文本格式化对稀疏嵌入至关重要，采用括号标注品牌、管道符分隔部分等方式保持词汇信号。

微调稀疏嵌入用于电子商务搜索 | 第一部分：为什么稀疏嵌入优于 BM25

2026-03-09 08:00 UTC+8

本文是系列文章的第一部分，探讨了在电子商务搜索中微调稀疏嵌入的优势。与密集嵌入相比，稀疏嵌入保留了精确匹配的关键细节，避免了语义模糊导致的不相关结果。文章介绍了SPLADE模型的工作原理、查询扩展能力以及Qdrant数据库对稀疏向量的原生支持。通过微调，该系统在Amazon ESCI数据集上实现了比BM25高出29%的性能提升。

密集嵌入在电子商务中会模糊精确匹配，导致不相关搜索结果。
稀疏嵌入通过大词汇空间保留每个词的重要性权重，实现精确匹配和可解释性。

基于距离的数据探索

2025-03-11 17:00 UTC+8

本文介绍如何利用Qdrant的距离矩阵API进行数据探索，包括降维、聚类和图表示等方法，帮助发现大规模非结构化数据中的隐藏结构。

Qdrant 1.12版推出的距离矩阵API简化了数据相似性分析，可高效计算距离矩阵。
使用UMAP进行降维，将高维数据映射到2D空间以可视化整体结构。

Qdrant 2024年夏季代码计划——Python中的ONNX交叉编码器

2024-10-14 13:00 UTC+8

本文中，Huong (Celine) Hoang分享了她在Qdrant夏季代码计划期间将ONNX交叉编码器集成到FastEmbed库的经历。该项目通过相关性分数实现搜索结果重排序，增强了上下文感知搜索应用的能力。主要挑战包括构建新的输入输出方案、分词处理、模型加载与测试。该功能已在FastEmbed 0.4.0中可用。

交叉编码器已集成到FastEmbed中，用于重排序任务。
项目使用ONNX模型，避免PyTorch等重型依赖。

什么是向量数据库？

2024-10-09 20:29 UTC+8

本文介绍向量数据库的基本概念、与传统数据库的区别、核心组件（ID、维度、负载）、架构（集合、距离度量、存储）、主要功能（索引、搜索、更新、删除），以及密集向量与稀疏向量、混合搜索、量化、分布式部署、多租户和数据安全等高级特性。

向量数据库将非结构化数据表示为高维向量，实现基于相似性的检索。
核心组件包括唯一ID、数值维度和包含元数据的负载。

什么是向量量化？

2024-09-25 20:29 UTC+8

向量量化是一种用于压缩高维数据的技术，通过减少内存占用同时保留关键信息，实现更高效的存储和搜索。本文介绍了三种主要的量化方法：标量量化、二进制量化和乘积量化，并讨论了如何平衡精度、速度和压缩率。

向量量化可显著降低内存使用并提升搜索速度，尤其适用于大规模数据集。
标量量化将float32映射到int8，减少75%内存，是大多数应用的安全默认选择。

Qdrant 1.7.0 正式发布！

2023-12-10 18:00 UTC+8

Qdrant 1.7.0 引入了对稀疏向量的原生支持，实现了关键词搜索与语义搜索的混合检索；全新的 Discovery API 提供了更精确的向量搜索方式，包括发现搜索和上下文搜索；用户自定义分片功能允许灵活控制数据分布；基于快照的分片传输机制提升了集群扩展效率。此外，还包含多项性能优化和稳定性改进。

原生支持稀疏向量，实现关键词与语义混合搜索
Discovery API 提供发现搜索和上下文搜索两种新模式

关于非结构化数据、向量数据库、AI新时代以及我们的种子轮融资

2023-04-19 08:42 UTC+8

Qdrant宣布完成750万美元种子轮融资，由Unusual Ventures领投。文章讨论向量数据库在AI时代的重要性，非结构化数据的爆炸式增长，以及Qdrant作为开源向量相似性搜索解决方案的进展和未来计划。

Qdrant获得750万美元种子轮融资，用于开发开源向量数据库。
向量数据库是AI新栈的基础组件，用于处理非结构化数据。

Qdrant Blog