AI News HubLIVE
公開文章 14採集文章 17可信度 82刷新頻率 120 分鐘
健康狀態 健康來源類型 官方原文權限 官方原文最近入庫 2026-06-25ID weaviate-blog運行狀態 已啟用

Official vector database and AI infrastructure feed; confirm reuse terms before full body display.

最新公開文章

Weaviate 1.38 發佈

此版本將基於磁盤的矢量索引 HFresh 和內置 MCP 服務器正式發佈,重新設計了集羣範圍的異步複製,並新增了 Boost API 和嵌套對象過濾兩個預覽功能。

  • HFresh 磁盤矢量索引正式可用,適用於流式工作負載
  • MCP 服務器正式可用,支持 LLM 和 AI 代理直接與 Weaviate 交互
站內正文

大規模使用 Weaviate 導入和向量化數據

大多數向量數據庫的原型在數據導入環節失敗,而非搜索。本文介紹了在 Weaviate 中大規模導入數據的最佳實踐,包括服務端批處理、錯誤處理、數據類型選擇、blobHash 的使用、多模態數據攝取以及避免常見陷阱。

  • 使用服務端批處理(server-side batching)自動調節批次大小,避免手動調優
  • 通過 deterministic UUID 實現重試冪等,避免重複工作和額外成本
站內正文

Weaviate Cloud 現可免費開始使用

Weaviate 宣佈其雲平台全面推出免費層級,包括託管數據庫、Query Agent 和 Engram 記憶層,無需信用卡且無時間限制,讓用户可以自由構建原型並長期使用。

  • Weaviate Cloud 現在整個產品套件都提供免費層級。
  • 免費層級包括託管的 Weaviate 數據庫、Query Agent 和 Engram 記憶層。
站內正文

Engram 現已正式發佈

Weaviate 宣佈其專為智能體應用設計的託管記憶與上下文服務 Engram 正式上線。它通過異步管道、模板和內置作用域,解決了長上下文退化、原始數據混亂和多智能體上下文碎片化等問題,幫助智能體積累經驗、優化決策。

  • Engram 是 Weaviate 推出的託管記憶與上下文服務,現已正式可用。
  • 旨在解決智能體在長期運行中面臨的長上下文退化、數據混亂和多智能體協調問題。
站內正文

使用 Weaviate MCP 構建編碼助手:對代碼與文檔進行 RAG 檢索

本文介紹如何利用 Weaviate 內置的 MCP 服務器為編碼助手(如 Claude Code、Cursor 和 VS Code)提供混合搜索能力,無需額外編寫膠水代碼。通過將代碼庫與文檔分塊並索引到 Weaviate,結合 BM25 精確匹配與向量語義檢索,LLM 智能代理可以高效獲取所需上下文,避免上下文過載與成本浪費。

  • LLM 訓練數據有截止期,且不瞭解私有代碼;直接粘貼代碼會導致上下文臃腫、成本高昂。
  • Weaviate MCP 將 MCP 服務器內建於數據庫,通過 /v1/mcp 端點暴露混合搜索、集合管理等工具。
站內正文

你的大語言模型(LLM)只取決於它檢索到的內容

一位研究人員認為,檢索質量是RAG系統中最重要的因素,勝過模型大小或提示設計。檢索差會導致難以檢測的幻覺,文章識別了五種常見的失效模式,並提供了改進檢索的實用建議,包括混合搜索、交叉編碼器重排序和持續評估。

  • 檢索質量是RAG系統輸出可靠性的主要決定因素。
  • 五種檢索失效模式:檢索漂移、上下文截斷、陳舊索引污染、低相關性top-k檢索以及智能體間溝通失誤。
站內正文

Weaviate v1.37 發佈:內置 MCP 服務器、可擴展分詞器、多樣性搜索與查詢分析預覽

Weaviate v1.37 正式發佈,帶來多項預覽功能:內置 MCP 服務器(與 AI 代理和 IDE 原生集成)、可擴展分詞器(支持變音摺疊與自定義停用詞)、基於最大邊際相關性(MMR)的多樣性搜索、查詢分析(按分片顯示耗時)。此外還新增增量備份、Gemini 音頻支持(multi2vec-google 模塊)和 BlobHash 屬性類型。

  • 內置 MCP 服務器預覽:允許 LLM 和 AI 代理通過標準協議直接與 Weaviate 交互,無需額外代碼。
  • 可擴展分詞器預覽:支持變音摺疊、自定義停用詞預設,並提供 tokenize 端點用於調試。
站內正文

Engram:由 Weaviate 提供支持的內存服務

Engram 是 Weaviate 推出的託管內存服務,專為智能體應用設計,旨在提供簡單易上手且高度可定製的記憶管理。它通過異步管道提取、整合並持久化記憶,支持主題、作用域和緩衝區等高級功能,助力智能體實現個性化與持續學習。

  • Engram 提供託管內存服務,基於 Weaviate 向量數據庫構建。
  • 支持異步管道處理,可自動提取、去重和更新記憶。
站內正文

Weaviate Shared Cloud 現已在 AWS 上全面上市

Weaviate Shared Cloud 在 AWS 美國東部和歐洲區域正式商用,為團隊提供完全託管的 AI 原生數據庫,支持在最適合的雲提供商和區域進行構建。

  • Weaviate Shared Cloud 現已在 AWS 美國東部(弗吉尼亞北部)和歐洲(法蘭克福)全面可用。
  • 提供完全託管的集羣、自動升級、細粒度 RBAC、不可變備份以及 SOC 2/ISO 27001 認證。
站內正文

記憶啊,你去哪兒了?

通過兩週在日常Claude Code會話中自用Engram(Weaviate的記憶產品),揭示了專用記憶產品的價值,以及當前與編程助手集成時的具體問題。

  • Claude默認使用MEMORY.md而非外部工具,因為其零延遲、零工具調用、始終在上下文中。
  • Engram通過主題結構化記憶,在決策追溯場景中效果顯著,但明確觸發條件才能發揮作用。
站內正文

多模態嵌入與RAG:實用指南

多模態嵌入使AI系統能夠直接搜索和推理文本、圖像、音頻和視頻,無需先轉換為文本。本文介紹了其工作原理,並通過Weaviate和Gemini展示了三種實際實現。

  • 多模態嵌入將不同模態映射到同一語義空間,實現跨模態檢索。
  • 使用原生嵌入而非橋接方式可避免信息丟失,如音頻的音調、PDF的佈局等。
站內正文

代碼即架構:Weaviate 託管型 C# 客户端

Weaviate 託管型 .NET 客户端為 C# 開發者帶來了類似 Entity Framework Core 的體驗,通過屬性驅動架構、類型安全查詢和自動遷移,簡化了向量數據庫的使用。

  • 使用 C# 屬性定義集合架構,無需字符串配置
  • 支持類型安全的 LINQ 風格向量搜索與混合搜索
站內正文

使用Weaviate保護企業AI安全

本文通過虛構的MedVector Health公司案例,詳細介紹瞭如何利用OIDC、RBAC、多租户隔離、審計日誌和網絡安全功能來保護Weaviate企業級部署,滿足HIPAA、GDPR等合規要求。

  • OIDC集成可將認證委託給現有身份提供商,消除共享API密鑰的安全風險。
  • 基於角色的訪問控制(RBAC)支持集合級和租户級權限,實現最小權限原則。
站內正文

在36小時內構建一個法律級RAG應用

本文介紹如何利用Weaviate的Query Agent和Agent Skills庫,在短短36小時內構建一個生產就緒的端到端RAG應用,用於法律合同檢索和問答。文章詳細對比了傳統RAG與智能代理搜索的差異,並提供了從數據攝入到前端部署的完整架構和步驟。

  • 傳統RAG在法律領域缺乏推理能力,而代理搜索通過自主工作流實現精準檢索。
  • 使用多向量模型和Muvera壓縮技術嵌入PDF頁面,保留佈局和表格信息。
站內正文

全部來源