AI News HubLIVE
公開文章 14採集文章 17可信度 82刷新頻率 120 分鐘
健康狀態 健康來源類型 官方原文權限 官方原文最近入庫 2026-06-25ID weaviate-blog運行狀態 已啟用

Official vector database and AI infrastructure feed; confirm reuse terms before full body display.

最新公開文章

Weaviate 1.38 釋出

此版本將基於磁碟的向量索引 HFresh 和內建 MCP 伺服器正式釋出,重新設計了叢集範圍的非同步複製,並新增了 Boost API 和巢狀物件過濾兩個預覽功能。

  • HFresh 磁碟向量索引正式可用,適用於流式工作負載
  • MCP 伺服器正式可用,支援 LLM 和 AI 代理直接與 Weaviate 互動
站內正文

大規模使用 Weaviate 匯入和向量化資料

大多數向量資料庫的原型在資料匯入環節失敗,而非搜尋。本文介紹了在 Weaviate 中大規模匯入資料的最佳實踐,包括服務端批處理、錯誤處理、資料型別選擇、blobHash 的使用、多模態資料攝取以及避免常見陷阱。

  • 使用服務端批處理(server-side batching)自動調節批次大小,避免手動調優
  • 透過 deterministic UUID 實現重試冪等,避免重複工作和額外成本
站內正文

Weaviate Cloud 現可免費開始使用

Weaviate 宣佈其雲平臺全面推出免費層級,包括託管資料庫、Query Agent 和 Engram 記憶層,無需信用卡且無時間限制,讓使用者可以自由構建原型並長期使用。

  • Weaviate Cloud 現在整個產品套件都提供免費層級。
  • 免費層級包括託管的 Weaviate 資料庫、Query Agent 和 Engram 記憶層。
站內正文

Engram 現已正式釋出

Weaviate 宣佈其專為智慧體應用設計的託管記憶與上下文服務 Engram 正式上線。它透過非同步管道、模板和內建作用域,解決了長上下文退化、原始資料混亂和多智慧體上下文碎片化等問題,幫助智慧體積累經驗、最佳化決策。

  • Engram 是 Weaviate 推出的託管記憶與上下文服務,現已正式可用。
  • 旨在解決智慧體在長期執行中面臨的長上下文退化、資料混亂和多智慧體協調問題。
站內正文

使用 Weaviate MCP 構建編碼助手:對程式碼與文件進行 RAG 檢索

本文介紹如何利用 Weaviate 內建的 MCP 伺服器為編碼助手(如 Claude Code、Cursor 和 VS Code)提供混合搜尋能力,無需額外編寫膠水程式碼。透過將程式碼庫與文件分塊並索引到 Weaviate,結合 BM25 精確匹配與向量語義檢索,LLM 智慧代理可以高效獲取所需上下文,避免上下文過載與成本浪費。

  • LLM 訓練資料有截止期,且不瞭解私有程式碼;直接貼上程式碼會導致上下文臃腫、成本高昂。
  • Weaviate MCP 將 MCP 伺服器內建於資料庫,透過 /v1/mcp 端點暴露混合搜尋、集合管理等工具。
站內正文

你的大語言模型(LLM)只取決於它檢索到的內容

一位研究人員認為,檢索質量是RAG系統中最重要的因素,勝過模型大小或提示設計。檢索差會導致難以檢測的幻覺,文章識別了五種常見的失效模式,並提供了改進檢索的實用建議,包括混合搜尋、交叉編碼器重排序和持續評估。

  • 檢索質量是RAG系統輸出可靠性的主要決定因素。
  • 五種檢索失效模式:檢索漂移、上下文截斷、陳舊索引汙染、低相關性top-k檢索以及智慧體間溝通失誤。
站內正文

Weaviate v1.37 釋出:內建 MCP 伺服器、可擴充套件分詞器、多樣性搜尋與查詢分析預覽

Weaviate v1.37 正式釋出,帶來多項預覽功能:內建 MCP 伺服器(與 AI 代理和 IDE 原生整合)、可擴充套件分詞器(支援變音摺疊與自定義停用詞)、基於最大邊際相關性(MMR)的多樣性搜尋、查詢分析(按分片顯示耗時)。此外還新增增量備份、Gemini 音訊支援(multi2vec-google 模組)和 BlobHash 屬性型別。

  • 內建 MCP 伺服器預覽:允許 LLM 和 AI 代理透過標準協議直接與 Weaviate 互動,無需額外程式碼。
  • 可擴充套件分詞器預覽:支援變音摺疊、自定義停用詞預設,並提供 tokenize 端點用於除錯。
站內正文

Engram:由 Weaviate 提供支援的記憶體服務

Engram 是 Weaviate 推出的託管記憶體服務,專為智慧體應用設計,旨在提供簡單易上手且高度可定製的記憶管理。它透過非同步管道提取、整合並持久化記憶,支援主題、作用域和緩衝區等高階功能,助力智慧體實現個性化與持續學習。

  • Engram 提供託管記憶體服務,基於 Weaviate 向量資料庫構建。
  • 支援非同步管道處理,可自動提取、去重和更新記憶。
站內正文

Weaviate Shared Cloud 現已在 AWS 上全面上市

Weaviate Shared Cloud 在 AWS 美國東部和歐洲區域正式商用,為團隊提供完全託管的 AI 原生資料庫,支援在最適合的雲提供商和區域進行構建。

  • Weaviate Shared Cloud 現已在 AWS 美國東部(弗吉尼亞北部)和歐洲(法蘭克福)全面可用。
  • 提供完全託管的叢集、自動升級、細粒度 RBAC、不可變備份以及 SOC 2/ISO 27001 認證。
站內正文

記憶啊,你去哪兒了?

透過兩週在日常Claude Code會話中自用Engram(Weaviate的記憶產品),揭示了專用記憶產品的價值,以及當前與程式設計助手整合時的具體問題。

  • Claude預設使用MEMORY.md而非外部工具,因為其零延遲、零工具呼叫、始終在上下文中。
  • Engram透過主題結構化記憶,在決策追溯場景中效果顯著,但明確觸發條件才能發揮作用。
站內正文

多模態嵌入與RAG:實用指南

多模態嵌入使AI系統能夠直接搜尋和推理文本、影像、音訊和影片,無需先轉換為文本。本文介紹了其工作原理,並透過Weaviate和Gemini展示了三種實際實現。

  • 多模態嵌入將不同模態對映到同一語義空間,實現跨模態檢索。
  • 使用原生嵌入而非橋接方式可避免資訊丟失,如音訊的音調、PDF的佈局等。
站內正文

程式碼即架構:Weaviate 託管型 C# 客戶端

Weaviate 託管型 .NET 客戶端為 C# 開發者帶來了類似 Entity Framework Core 的體驗,透過屬性驅動架構、型別安全查詢和自動遷移,簡化了向量資料庫的使用。

  • 使用 C# 屬性定義集合架構,無需字串配置
  • 支援型別安全的 LINQ 風格向量搜尋與混合搜尋
站內正文

使用Weaviate保護企業AI安全

本文透過虛構的MedVector Health公司案例,詳細介紹瞭如何利用OIDC、RBAC、多租戶隔離、審計日誌和網路安全功能來保護Weaviate企業級部署,滿足HIPAA、GDPR等合規要求。

  • OIDC整合可將認證委託給現有身份提供商,消除共享API金鑰的安全風險。
  • 基於角色的訪問控制(RBAC)支援集合級和租戶級許可權,實現最小許可權原則。
站內正文

在36小時內構建一個法律級RAG應用

本文介紹如何利用Weaviate的Query Agent和Agent Skills庫,在短短36小時內構建一個生產就緒的端到端RAG應用,用於法律合同檢索和問答。文章詳細對比了傳統RAG與智慧代理搜尋的差異,並提供了從資料攝入到前端部署的完整架構和步驟。

  • 傳統RAG在法律領域缺乏推理能力,而代理搜尋透過自主工作流實現精準檢索。
  • 使用多向量模型和Muvera壓縮技術嵌入PDF頁面,保留佈局和表格資訊。
站內正文

全部來源