Weaviate 1.38 釋出
此版本將基於磁碟的向量索引 HFresh 和內建 MCP 伺服器正式釋出,重新設計了叢集範圍的非同步複製,並新增了 Boost API 和巢狀物件過濾兩個預覽功能。
- HFresh 磁碟向量索引正式可用,適用於流式工作負載
- MCP 伺服器正式可用,支援 LLM 和 AI 代理直接與 Weaviate 互動
Official vector database and AI infrastructure feed; confirm reuse terms before full body display.
此版本將基於磁碟的向量索引 HFresh 和內建 MCP 伺服器正式釋出,重新設計了叢集範圍的非同步複製,並新增了 Boost API 和巢狀物件過濾兩個預覽功能。
大多數向量資料庫的原型在資料匯入環節失敗,而非搜尋。本文介紹了在 Weaviate 中大規模匯入資料的最佳實踐,包括服務端批處理、錯誤處理、資料型別選擇、blobHash 的使用、多模態資料攝取以及避免常見陷阱。
Weaviate 宣佈其雲平臺全面推出免費層級,包括託管資料庫、Query Agent 和 Engram 記憶層,無需信用卡且無時間限制,讓使用者可以自由構建原型並長期使用。
Weaviate 宣佈其專為智慧體應用設計的託管記憶與上下文服務 Engram 正式上線。它透過非同步管道、模板和內建作用域,解決了長上下文退化、原始資料混亂和多智慧體上下文碎片化等問題,幫助智慧體積累經驗、最佳化決策。
本文介紹如何利用 Weaviate 內建的 MCP 伺服器為編碼助手(如 Claude Code、Cursor 和 VS Code)提供混合搜尋能力,無需額外編寫膠水程式碼。透過將程式碼庫與文件分塊並索引到 Weaviate,結合 BM25 精確匹配與向量語義檢索,LLM 智慧代理可以高效獲取所需上下文,避免上下文過載與成本浪費。
一位研究人員認為,檢索質量是RAG系統中最重要的因素,勝過模型大小或提示設計。檢索差會導致難以檢測的幻覺,文章識別了五種常見的失效模式,並提供了改進檢索的實用建議,包括混合搜尋、交叉編碼器重排序和持續評估。
Weaviate v1.37 正式釋出,帶來多項預覽功能:內建 MCP 伺服器(與 AI 代理和 IDE 原生整合)、可擴充套件分詞器(支援變音摺疊與自定義停用詞)、基於最大邊際相關性(MMR)的多樣性搜尋、查詢分析(按分片顯示耗時)。此外還新增增量備份、Gemini 音訊支援(multi2vec-google 模組)和 BlobHash 屬性型別。
Engram 是 Weaviate 推出的託管記憶體服務,專為智慧體應用設計,旨在提供簡單易上手且高度可定製的記憶管理。它透過非同步管道提取、整合並持久化記憶,支援主題、作用域和緩衝區等高階功能,助力智慧體實現個性化與持續學習。
Weaviate Shared Cloud 在 AWS 美國東部和歐洲區域正式商用,為團隊提供完全託管的 AI 原生資料庫,支援在最適合的雲提供商和區域進行構建。
透過兩週在日常Claude Code會話中自用Engram(Weaviate的記憶產品),揭示了專用記憶產品的價值,以及當前與程式設計助手整合時的具體問題。
多模態嵌入使AI系統能夠直接搜尋和推理文本、影像、音訊和影片,無需先轉換為文本。本文介紹了其工作原理,並透過Weaviate和Gemini展示了三種實際實現。
Weaviate 託管型 .NET 客戶端為 C# 開發者帶來了類似 Entity Framework Core 的體驗,透過屬性驅動架構、型別安全查詢和自動遷移,簡化了向量資料庫的使用。
本文透過虛構的MedVector Health公司案例,詳細介紹瞭如何利用OIDC、RBAC、多租戶隔離、審計日誌和網路安全功能來保護Weaviate企業級部署,滿足HIPAA、GDPR等合規要求。
本文介紹如何利用Weaviate的Query Agent和Agent Skills庫,在短短36小時內構建一個生產就緒的端到端RAG應用,用於法律合同檢索和問答。文章詳細對比了傳統RAG與智慧代理搜尋的差異,並提供了從資料攝入到前端部署的完整架構和步驟。