Weaviate Blog AI 新闻来源

公开文章 14采集文章 17可信度 82刷新频率 120 分钟

健康状态健康来源类型官方原文权限 官方原文最近入库 2026-06-25ID weaviate-blog运行状态 已启用

Official vector database and AI infrastructure feed; confirm reuse terms before full body display.

最新公开文章

Weaviate 1.38 发布

2026-06-25 08:00 UTC+8

此版本将基于磁盘的矢量索引 HFresh 和内置 MCP 服务器正式发布，重新设计了集群范围的异步复制，并新增了 Boost API 和嵌套对象过滤两个预览功能。

HFresh 磁盘矢量索引正式可用，适用于流式工作负载
MCP 服务器正式可用，支持 LLM 和 AI 代理直接与 Weaviate 交互

大规模使用 Weaviate 导入和向量化数据

2026-06-18 08:00 UTC+8

大多数向量数据库的原型在数据导入环节失败，而非搜索。本文介绍了在 Weaviate 中大规模导入数据的最佳实践，包括服务端批处理、错误处理、数据类型选择、blobHash 的使用、多模态数据摄取以及避免常见陷阱。

使用服务端批处理（server-side batching）自动调节批次大小，避免手动调优
通过 deterministic UUID 实现重试幂等，避免重复工作和额外成本

Weaviate Cloud 现可免费开始使用

2026-06-17 08:00 UTC+8

Weaviate 宣布其云平台全面推出免费层级，包括托管数据库、Query Agent 和 Engram 记忆层，无需信用卡且无时间限制，让用户可以自由构建原型并长期使用。

Weaviate Cloud 现在整个产品套件都提供免费层级。
免费层级包括托管的 Weaviate 数据库、Query Agent 和 Engram 记忆层。

Engram 现已正式发布

2026-06-03 08:00 UTC+8

Weaviate 宣布其专为智能体应用设计的托管记忆与上下文服务 Engram 正式上线。它通过异步管道、模板和内置作用域，解决了长上下文退化、原始数据混乱和多智能体上下文碎片化等问题，帮助智能体积累经验、优化决策。

Engram 是 Weaviate 推出的托管记忆与上下文服务，现已正式可用。
旨在解决智能体在长期运行中面临的长上下文退化、数据混乱和多智能体协调问题。

使用 Weaviate MCP 构建编码助手：对代码与文档进行 RAG 检索

2026-05-21 08:00 UTC+8

本文介绍如何利用 Weaviate 内置的 MCP 服务器为编码助手（如 Claude Code、Cursor 和 VS Code）提供混合搜索能力，无需额外编写胶水代码。通过将代码库与文档分块并索引到 Weaviate，结合 BM25 精确匹配与向量语义检索，LLM 智能代理可以高效获取所需上下文，避免上下文过载与成本浪费。

LLM 训练数据有截止期，且不了解私有代码；直接粘贴代码会导致上下文臃肿、成本高昂。
Weaviate MCP 将 MCP 服务器内建于数据库，通过 /v1/mcp 端点暴露混合搜索、集合管理等工具。

你的大语言模型（LLM）只取决于它检索到的内容

2026-05-06 08:00 UTC+8

一位研究人员认为，检索质量是RAG系统中最重要的因素，胜过模型大小或提示设计。检索差会导致难以检测的幻觉，文章识别了五种常见的失效模式，并提供了改进检索的实用建议，包括混合搜索、交叉编码器重排序和持续评估。

检索质量是RAG系统输出可靠性的主要决定因素。
五种检索失效模式：检索漂移、上下文截断、陈旧索引污染、低相关性top-k检索以及智能体间沟通失误。

Weaviate v1.37 发布：内置 MCP 服务器、可扩展分词器、多样性搜索与查询分析预览

2026-04-23 08:00 UTC+8

Weaviate v1.37 正式发布，带来多项预览功能：内置 MCP 服务器（与 AI 代理和 IDE 原生集成）、可扩展分词器（支持变音折叠与自定义停用词）、基于最大边际相关性（MMR）的多样性搜索、查询分析（按分片显示耗时）。此外还新增增量备份、Gemini 音频支持（multi2vec-google 模块）和 BlobHash 属性类型。

内置 MCP 服务器预览：允许 LLM 和 AI 代理通过标准协议直接与 Weaviate 交互，无需额外代码。
可扩展分词器预览：支持变音折叠、自定义停用词预设，并提供 tokenize 端点用于调试。

Engram：由 Weaviate 提供支持的内存服务

2026-04-21 08:00 UTC+8

Engram 是 Weaviate 推出的托管内存服务，专为智能体应用设计，旨在提供简单易上手且高度可定制的记忆管理。它通过异步管道提取、整合并持久化记忆，支持主题、作用域和缓冲区等高级功能，助力智能体实现个性化与持续学习。

Engram 提供托管内存服务，基于 Weaviate 向量数据库构建。
支持异步管道处理，可自动提取、去重和更新记忆。

Weaviate Shared Cloud 现已在 AWS 上全面上市

2026-04-15 08:00 UTC+8

Weaviate Shared Cloud 在 AWS 美国东部和欧洲区域正式商用，为团队提供完全托管的 AI 原生数据库，支持在最适合的云提供商和区域进行构建。

Weaviate Shared Cloud 现已在 AWS 美国东部（弗吉尼亚北部）和欧洲（法兰克福）全面可用。
提供完全托管的集群、自动升级、细粒度 RBAC、不可变备份以及 SOC 2/ISO 27001 认证。

记忆啊，你去哪儿了？

2026-04-02 08:00 UTC+8

通过两周在日常Claude Code会话中自用Engram（Weaviate的记忆产品），揭示了专用记忆产品的价值，以及当前与编程助手集成时的具体问题。

Claude默认使用MEMORY.md而非外部工具，因为其零延迟、零工具调用、始终在上下文中。
Engram通过主题结构化记忆，在决策追溯场景中效果显著，但明确触发条件才能发挥作用。

多模态嵌入与RAG：实用指南

2026-04-01 08:00 UTC+8

多模态嵌入使AI系统能够直接搜索和推理文本、图像、音频和视频，无需先转换为文本。本文介绍了其工作原理，并通过Weaviate和Gemini展示了三种实际实现。

多模态嵌入将不同模态映射到同一语义空间，实现跨模态检索。
使用原生嵌入而非桥接方式可避免信息丢失，如音频的音调、PDF的布局等。

代码即架构：Weaviate 托管型 C# 客户端

2026-03-31 08:00 UTC+8

Weaviate 托管型 .NET 客户端为 C# 开发者带来了类似 Entity Framework Core 的体验，通过属性驱动架构、类型安全查询和自动迁移，简化了向量数据库的使用。

使用 C# 属性定义集合架构，无需字符串配置
支持类型安全的 LINQ 风格向量搜索与混合搜索

使用Weaviate保护企业AI安全

2026-03-19 08:00 UTC+8

本文通过虚构的MedVector Health公司案例，详细介绍了如何利用OIDC、RBAC、多租户隔离、审计日志和网络安全功能来保护Weaviate企业级部署，满足HIPAA、GDPR等合规要求。

OIDC集成可将认证委托给现有身份提供商，消除共享API密钥的安全风险。
基于角色的访问控制（RBAC）支持集合级和租户级权限，实现最小权限原则。

在36小时内构建一个法律级RAG应用

2026-02-26 08:00 UTC+8

本文介绍如何利用Weaviate的Query Agent和Agent Skills库，在短短36小时内构建一个生产就绪的端到端RAG应用，用于法律合同检索和问答。文章详细对比了传统RAG与智能代理搜索的差异，并提供了从数据摄入到前端部署的完整架构和步骤。

传统RAG在法律领域缺乏推理能力，而代理搜索通过自主工作流实现精准检索。
使用多向量模型和Muvera压缩技术嵌入PDF页面，保留布局和表格信息。

Weaviate Blog