AI News HubLIVE
站内改写

AWS為何徹底重構OpenSearch架構以應對代理工作負載

AWS完全重構了OpenSearch Serverless,分離儲存和計算,支援零成本空閒縮放,成本降低60%,自動縮放速度提升20倍,並針對AI代理的突發工作負載最佳化。新架構包括專有儲存層、GPU加速,並整合Vercel和Kiro IDE。未來將推出代理記憶體、日誌分析(6月)和搜尋推理模型。

文章情報

工程師進階

要點

  • AWS對OpenSearch Serverless進行了近97%的重構,分離儲存和計算,實現空閒時縮放至零。
  • 新架構針對AI代理的突發工作負載,自動縮放速度提升20倍,成本降低60%。
  • 支援搜尋和向量集合,整合Vercel、Kiro IDE及多種Agent Skills。
  • 路線圖包括代理長期記憶體(2026年)、日誌分析(6月)和搜尋推理模型。

為什麼重要

這條新聞值得關注,因為AWS對OpenSearch Serverless進行了近97%的重構,分離儲存和計算,實現空閒時縮放至零。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

AWS於週四推出了一項重大更新,對其託管搜尋和向量引擎OpenSearch Serverless進行了近乎徹底的重構,以更好地滿足AI代理時代的需求。新一代架構實現了空閒時縮放至零的能力,並且與峰值容量執行時的預置叢集相比,成本可降低高達60%。

這一變革源於AI代理的使用模式——它們往往以突發方式出現,伴隨長時間的空閒期,這本質上打破了原始無伺服器架構的假設。OpenSearch的總經理Tia White(於2月上任)向The New Stack表示:“大約97%的程式碼由託管服務的工程師從零開始構建。大部分是徹底的重構。其餘部分來自開源倉庫,但任何真正的新穎或智慧財產權部分都不會開源。”

最重大的架構變化是儲存和計算的分離。OpenSearch現在執行在一個新的專有儲存層上。“集合可以真正縮小到零,這意味著如果你的資源不活躍,你無需支付任何費用,”White解釋道。“然後它們可以在幾秒鐘內重新啟動,以處理代理的需求,因為我們不希望出現冷啟動問題。”該服務還支援搜尋和向量集合型別,按OpenSearch計算單元(OCU)定價,涵蓋索引、搜尋和GPU加速。

成本節省60%來自兩個方面:新的專有儲存層及其壓縮功能,以及自動縮放器在流量下降時能迅速降低容量。“由於我們能夠預測你的需求,並且能夠快速交付和縮減,你將自動節省資金,”White說。

White坦言OpenSearch過去存在的問題:“OpenSearch一直是瑞士軍刀,是一個大雜燴。我們去年甚至嘗試轉向SIEM。”但那次嘗試未能持續。現在,OpenSearch圍繞代理工作負載,將傳統搜尋與日誌分析相結合。

關於未來路線圖,代理的長期記憶體功能計劃於2026年下半年推出,內建評估和治理機制。White指出:“評估既是一門藝術也是一門科學。什麼樣的內容應該儲存或清除——這是一個持續的反饋迴圈。”此外,知識圖譜和語義層的功能也在開發中,以及“針對搜尋工作負載的高階推理模型”。

一場重要的日誌分析釋出計劃於6月進行,這將使AWS重返由Datadog、Splunk和Grafana主導的市場。TIMESERIES集合型別將在AWS紐約峰會上推出,以擴充套件可觀測性工作負載。White還表示:“當精度和令牌最佳化到位時,人們可能會問LLM能否取代像OpenSearch這樣的東西。”但AWS的答案是,OpenSearch Serverless將成為LLM呼叫的重要語義層,而非被取代。