Weaviate 1.38 釋出
此版本將基於磁碟的向量索引 HFresh 和內建 MCP 伺服器正式釋出,重新設計了叢集範圍的非同步複製,並新增了 Boost API 和巢狀物件過濾兩個預覽功能。
Weaviate v1.38 現已開源並在 Weaviate Cloud 上可用。
此版本將兩項功能正式推出:HFresh 磁碟向量索引和內建 MCP 伺服器。非同步複製已重構為從單個排程器跨叢集執行,並且現在預設在每個副本集合上啟用。同時新增加了兩個預覽功能:Boost API 用於查詢時重新評分,以及巢狀物件過濾。
HFresh 向量索引(正式可用)
HFresh 是基於磁碟的向量索引,受 SPFresh 演算法啟發。它將向量分組到磁碟上的區域(稱為釋出列表),並在記憶體中保留一個小型 HNSW 索引來管理這些區域的重心,從而決定讀取哪些區域。隨著集合增長到數十億級別,記憶體佔用保持低位,延遲保持可預測。HFresh 支援餘弦和 L2 平方距離度量,並內建 RQ-1 量化。與需要在磁碟上週期性重建的索引不同,HFresh 透過增量重新平衡(拆分過大的釋出列表、合併過小的釋出列表、重新分配向量)來維持效能。要啟用 HFresh,只需在向量配置中設定 vector_index_config 為 hfresh 即可。
MCP 伺服器(正式可用)
內建的模型上下文協議(MCP)伺服器現已正式可用。它使 LLM、IDE 和 AI 代理能夠直接與 Weaviate 互動——檢查模式、執行混合搜尋以及寫入物件——無需膠水程式碼。該伺服器在 /v1/mcp 端點上作為 Streamable HTTP 端點執行,使用 Bearer/API 金鑰進行身份驗證,並遵守 Weaviate 的標準 RBAC 許可權。它公開了四個工具:檢查集合配置、列出多租戶集合的租戶、執行混合搜尋以及插入或更新物件。在 v1.38 中,MCP 伺服器的啟用標記現在可以在執行時配置,無需重啟叢集。
非同步複製,無處不在
非同步複製是在複製因子大於 1 的集合上保持副本同步的後臺修復過程。在 v1.38 中,它已重新架構為從單個排程器跨叢集執行,而不是按集合單獨配置和執行。現在它預設在每個 RF > 1 的集合上啟用。一個排程器協調所有複製集合的非同步修復,共享一個工作執行緒池。之前的按集合設定 maxWorkers 和 enabled 已被移除,取而代之的是兩個叢集級控制:ASYNC_REPLICATION_SCHEDULER_WORKERS(設定共享池大小)和 ASYNC_REPLICATION_DISABLED(執行時殺死開關)。
Boost API(預覽)
有時候您希望調整結果而不刪除任何結果。過濾器過於生硬——它會刪除所有不匹配的結果——而實際上您可能希望將新鮮文章排名更高,或優先顯示庫存產品,同時保留完整結果集。新的 Boost API 正是為此而生。Boost 在主要搜尋之後執行,透過將原始分數與一個或多個提升條件混合來重新評分候選結果,然後重新排序——提升或降低結果,而不刪除任何結果。條件可以基於過濾器匹配、屬性值、時間衰減或數值衰減。權重(0-1)決定了提升對最終分數的影響。Boost 僅透過 gRPC 可用,單個查詢最多可應用 20 個條件。
巢狀物件過濾(預覽)
Weaviate v1.38 增加了一個預覽功能,允許對巢狀物件屬性進行過濾。在此之前,object 和 object[] 屬性可以儲存但無法直接過濾。現在,您可以透過點路徑(例如 cars.make)引用巢狀欄位進行過濾。該功能預設關閉,需要透過環境變數 WEAVIATE_PREVIEW_NESTED_FILTERING 啟用。一旦啟用,點路徑可以在任何需要屬性名稱的地方使用,包括來自客戶端。這適用於 object 和 object[] 屬性內的巢狀資料。
效能改進和修復
除了主要功能外,v1.38 還包含一系列改進: 生產就緒的副本移動(基於變更捕獲日誌)、預設向量索引型別設定、使用限制(物件數、集合數、租戶數、分片數的伺服器端限制)、新模組 text2vec-digitalocean、備份可靠性改進(不再暫停壓縮,物件儲存列表更快)、分數 BM25 屬性提升、確定性平局打破、更快的啟動速度和改進的壓縮向量索引快取。
社群貢獻
感謝多位首次貢獻者的貢獻,包括 @dillonledoux(text2vec-digitalocean 模組)、@anishesg(倒排索引和 HFresh 修復)、@msnandhis(分數 BM25 屬性提升)、@3em0(拒絕重複靜態 API 金鑰)、@kedar49(DB 使用者識別符號衝突檢查)和 @SAY-5(HFresh 穩定性修復)。
總結
Weaviate v1.38 將兩項功能正式釋出(HFresh 和 MCP 伺服器),同時重構了非同步複製路徑並新增了兩個預覽功能。關鍵亮點包括:HFresh(正式可用)用於流式工作負載,MCP 伺服器(正式可用)提供 AI 代理整合,叢集範圍的非同步複製預設啟用,以及 Boost API 和巢狀物件過濾的預覽。
開始使用吧!
該版本已在 GitHub 上開源,並已在 Weaviate Cloud 上提供新沙盒。升級自託管版本的使用者請檢視遷移指南中的版本說明。