Weaviate 1.38 发布
此版本将基于磁盘的矢量索引 HFresh 和内置 MCP 服务器正式发布,重新设计了集群范围的异步复制,并新增了 Boost API 和嵌套对象过滤两个预览功能。
- HFresh 磁盘矢量索引正式可用,适用于流式工作负载
- MCP 服务器正式可用,支持 LLM 和 AI 代理直接与 Weaviate 交互
Official vector database and AI infrastructure feed; confirm reuse terms before full body display.
此版本将基于磁盘的矢量索引 HFresh 和内置 MCP 服务器正式发布,重新设计了集群范围的异步复制,并新增了 Boost API 和嵌套对象过滤两个预览功能。
大多数向量数据库的原型在数据导入环节失败,而非搜索。本文介绍了在 Weaviate 中大规模导入数据的最佳实践,包括服务端批处理、错误处理、数据类型选择、blobHash 的使用、多模态数据摄取以及避免常见陷阱。
Weaviate 宣布其云平台全面推出免费层级,包括托管数据库、Query Agent 和 Engram 记忆层,无需信用卡且无时间限制,让用户可以自由构建原型并长期使用。
Weaviate 宣布其专为智能体应用设计的托管记忆与上下文服务 Engram 正式上线。它通过异步管道、模板和内置作用域,解决了长上下文退化、原始数据混乱和多智能体上下文碎片化等问题,帮助智能体积累经验、优化决策。
本文介绍如何利用 Weaviate 内置的 MCP 服务器为编码助手(如 Claude Code、Cursor 和 VS Code)提供混合搜索能力,无需额外编写胶水代码。通过将代码库与文档分块并索引到 Weaviate,结合 BM25 精确匹配与向量语义检索,LLM 智能代理可以高效获取所需上下文,避免上下文过载与成本浪费。
一位研究人员认为,检索质量是RAG系统中最重要的因素,胜过模型大小或提示设计。检索差会导致难以检测的幻觉,文章识别了五种常见的失效模式,并提供了改进检索的实用建议,包括混合搜索、交叉编码器重排序和持续评估。
Weaviate v1.37 正式发布,带来多项预览功能:内置 MCP 服务器(与 AI 代理和 IDE 原生集成)、可扩展分词器(支持变音折叠与自定义停用词)、基于最大边际相关性(MMR)的多样性搜索、查询分析(按分片显示耗时)。此外还新增增量备份、Gemini 音频支持(multi2vec-google 模块)和 BlobHash 属性类型。
Engram 是 Weaviate 推出的托管内存服务,专为智能体应用设计,旨在提供简单易上手且高度可定制的记忆管理。它通过异步管道提取、整合并持久化记忆,支持主题、作用域和缓冲区等高级功能,助力智能体实现个性化与持续学习。
Weaviate Shared Cloud 在 AWS 美国东部和欧洲区域正式商用,为团队提供完全托管的 AI 原生数据库,支持在最适合的云提供商和区域进行构建。
通过两周在日常Claude Code会话中自用Engram(Weaviate的记忆产品),揭示了专用记忆产品的价值,以及当前与编程助手集成时的具体问题。
多模态嵌入使AI系统能够直接搜索和推理文本、图像、音频和视频,无需先转换为文本。本文介绍了其工作原理,并通过Weaviate和Gemini展示了三种实际实现。
Weaviate 托管型 .NET 客户端为 C# 开发者带来了类似 Entity Framework Core 的体验,通过属性驱动架构、类型安全查询和自动迁移,简化了向量数据库的使用。
本文通过虚构的MedVector Health公司案例,详细介绍了如何利用OIDC、RBAC、多租户隔离、审计日志和网络安全功能来保护Weaviate企业级部署,满足HIPAA、GDPR等合规要求。
本文介绍如何利用Weaviate的Query Agent和Agent Skills库,在短短36小时内构建一个生产就绪的端到端RAG应用,用于法律合同检索和问答。文章详细对比了传统RAG与智能代理搜索的差异,并提供了从数据摄入到前端部署的完整架构和步骤。