AI News HubLIVE
公开文章 14采集文章 17可信度 82刷新频率 120 分钟
健康状态 健康来源类型 官方原文权限 官方原文最近入库 2026-06-25ID weaviate-blog运行状态 已启用

Official vector database and AI infrastructure feed; confirm reuse terms before full body display.

最新公开文章

Weaviate 1.38 发布

此版本将基于磁盘的矢量索引 HFresh 和内置 MCP 服务器正式发布,重新设计了集群范围的异步复制,并新增了 Boost API 和嵌套对象过滤两个预览功能。

  • HFresh 磁盘矢量索引正式可用,适用于流式工作负载
  • MCP 服务器正式可用,支持 LLM 和 AI 代理直接与 Weaviate 交互
站内正文

大规模使用 Weaviate 导入和向量化数据

大多数向量数据库的原型在数据导入环节失败,而非搜索。本文介绍了在 Weaviate 中大规模导入数据的最佳实践,包括服务端批处理、错误处理、数据类型选择、blobHash 的使用、多模态数据摄取以及避免常见陷阱。

  • 使用服务端批处理(server-side batching)自动调节批次大小,避免手动调优
  • 通过 deterministic UUID 实现重试幂等,避免重复工作和额外成本
站内正文

Weaviate Cloud 现可免费开始使用

Weaviate 宣布其云平台全面推出免费层级,包括托管数据库、Query Agent 和 Engram 记忆层,无需信用卡且无时间限制,让用户可以自由构建原型并长期使用。

  • Weaviate Cloud 现在整个产品套件都提供免费层级。
  • 免费层级包括托管的 Weaviate 数据库、Query Agent 和 Engram 记忆层。
站内正文

Engram 现已正式发布

Weaviate 宣布其专为智能体应用设计的托管记忆与上下文服务 Engram 正式上线。它通过异步管道、模板和内置作用域,解决了长上下文退化、原始数据混乱和多智能体上下文碎片化等问题,帮助智能体积累经验、优化决策。

  • Engram 是 Weaviate 推出的托管记忆与上下文服务,现已正式可用。
  • 旨在解决智能体在长期运行中面临的长上下文退化、数据混乱和多智能体协调问题。
站内正文

使用 Weaviate MCP 构建编码助手:对代码与文档进行 RAG 检索

本文介绍如何利用 Weaviate 内置的 MCP 服务器为编码助手(如 Claude Code、Cursor 和 VS Code)提供混合搜索能力,无需额外编写胶水代码。通过将代码库与文档分块并索引到 Weaviate,结合 BM25 精确匹配与向量语义检索,LLM 智能代理可以高效获取所需上下文,避免上下文过载与成本浪费。

  • LLM 训练数据有截止期,且不了解私有代码;直接粘贴代码会导致上下文臃肿、成本高昂。
  • Weaviate MCP 将 MCP 服务器内建于数据库,通过 /v1/mcp 端点暴露混合搜索、集合管理等工具。
站内正文

你的大语言模型(LLM)只取决于它检索到的内容

一位研究人员认为,检索质量是RAG系统中最重要的因素,胜过模型大小或提示设计。检索差会导致难以检测的幻觉,文章识别了五种常见的失效模式,并提供了改进检索的实用建议,包括混合搜索、交叉编码器重排序和持续评估。

  • 检索质量是RAG系统输出可靠性的主要决定因素。
  • 五种检索失效模式:检索漂移、上下文截断、陈旧索引污染、低相关性top-k检索以及智能体间沟通失误。
站内正文

Weaviate v1.37 发布:内置 MCP 服务器、可扩展分词器、多样性搜索与查询分析预览

Weaviate v1.37 正式发布,带来多项预览功能:内置 MCP 服务器(与 AI 代理和 IDE 原生集成)、可扩展分词器(支持变音折叠与自定义停用词)、基于最大边际相关性(MMR)的多样性搜索、查询分析(按分片显示耗时)。此外还新增增量备份、Gemini 音频支持(multi2vec-google 模块)和 BlobHash 属性类型。

  • 内置 MCP 服务器预览:允许 LLM 和 AI 代理通过标准协议直接与 Weaviate 交互,无需额外代码。
  • 可扩展分词器预览:支持变音折叠、自定义停用词预设,并提供 tokenize 端点用于调试。
站内正文

Engram:由 Weaviate 提供支持的内存服务

Engram 是 Weaviate 推出的托管内存服务,专为智能体应用设计,旨在提供简单易上手且高度可定制的记忆管理。它通过异步管道提取、整合并持久化记忆,支持主题、作用域和缓冲区等高级功能,助力智能体实现个性化与持续学习。

  • Engram 提供托管内存服务,基于 Weaviate 向量数据库构建。
  • 支持异步管道处理,可自动提取、去重和更新记忆。
站内正文

Weaviate Shared Cloud 现已在 AWS 上全面上市

Weaviate Shared Cloud 在 AWS 美国东部和欧洲区域正式商用,为团队提供完全托管的 AI 原生数据库,支持在最适合的云提供商和区域进行构建。

  • Weaviate Shared Cloud 现已在 AWS 美国东部(弗吉尼亚北部)和欧洲(法兰克福)全面可用。
  • 提供完全托管的集群、自动升级、细粒度 RBAC、不可变备份以及 SOC 2/ISO 27001 认证。
站内正文

记忆啊,你去哪儿了?

通过两周在日常Claude Code会话中自用Engram(Weaviate的记忆产品),揭示了专用记忆产品的价值,以及当前与编程助手集成时的具体问题。

  • Claude默认使用MEMORY.md而非外部工具,因为其零延迟、零工具调用、始终在上下文中。
  • Engram通过主题结构化记忆,在决策追溯场景中效果显著,但明确触发条件才能发挥作用。
站内正文

多模态嵌入与RAG:实用指南

多模态嵌入使AI系统能够直接搜索和推理文本、图像、音频和视频,无需先转换为文本。本文介绍了其工作原理,并通过Weaviate和Gemini展示了三种实际实现。

  • 多模态嵌入将不同模态映射到同一语义空间,实现跨模态检索。
  • 使用原生嵌入而非桥接方式可避免信息丢失,如音频的音调、PDF的布局等。
站内正文

代码即架构:Weaviate 托管型 C# 客户端

Weaviate 托管型 .NET 客户端为 C# 开发者带来了类似 Entity Framework Core 的体验,通过属性驱动架构、类型安全查询和自动迁移,简化了向量数据库的使用。

  • 使用 C# 属性定义集合架构,无需字符串配置
  • 支持类型安全的 LINQ 风格向量搜索与混合搜索
站内正文

使用Weaviate保护企业AI安全

本文通过虚构的MedVector Health公司案例,详细介绍了如何利用OIDC、RBAC、多租户隔离、审计日志和网络安全功能来保护Weaviate企业级部署,满足HIPAA、GDPR等合规要求。

  • OIDC集成可将认证委托给现有身份提供商,消除共享API密钥的安全风险。
  • 基于角色的访问控制(RBAC)支持集合级和租户级权限,实现最小权限原则。
站内正文

在36小时内构建一个法律级RAG应用

本文介绍如何利用Weaviate的Query Agent和Agent Skills库,在短短36小时内构建一个生产就绪的端到端RAG应用,用于法律合同检索和问答。文章详细对比了传统RAG与智能代理搜索的差异,并提供了从数据摄入到前端部署的完整架构和步骤。

  • 传统RAG在法律领域缺乏推理能力,而代理搜索通过自主工作流实现精准检索。
  • 使用多向量模型和Muvera压缩技术嵌入PDF页面,保留布局和表格信息。
站内正文

全部来源