AI News HubLIVE
站内改写

AWS為何徹底重構OpenSearch架構以應對代理工作負載

AWS完全重構了OpenSearch Serverless,分離存儲和計算,支持零成本空閒縮放,成本降低60%,自動縮放速度提升20倍,並針對AI代理的突發工作負載優化。新架構包括專有存儲層、GPU加速,並整合Vercel和Kiro IDE。未來將推出代理內存、日誌分析(6月)和搜索推理模型。

文章情報

工程師進階

要點

  • AWS對OpenSearch Serverless進行了近97%的重構,分離存儲和計算,實現空閒時縮放至零。
  • 新架構針對AI代理的突發工作負載,自動縮放速度提升20倍,成本降低60%。
  • 支持搜索和向量集合,集成Vercel、Kiro IDE及多種Agent Skills。
  • 路線圖包括代理長期內存(2026年)、日誌分析(6月)和搜索推理模型。

為甚麼重要

這條新聞值得關注,因為AWS對OpenSearch Serverless進行了近97%的重構,分離存儲和計算,實現空閒時縮放至零。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

AWS於週四推出了一項重大更新,對其託管搜索和向量引擎OpenSearch Serverless進行了近乎徹底的重構,以更好地滿足AI代理時代的需求。新一代架構實現了空閒時縮放至零的能力,並且與峯值容量運行時的預置集羣相比,成本可降低高達60%。

這一變革源於AI代理的使用模式——它們往往以突發方式出現,伴隨長時間的空閒期,這本質上打破了原始無服務器架構的假設。OpenSearch的總經理Tia White(於2月上任)向The New Stack表示:“大約97%的代碼由託管服務的工程師從零開始構建。大部分是徹底的重構。其餘部分來自開源倉庫,但任何真正的新穎或知識產權部分都不會開源。”

最重大的架構變化是存儲和計算的分離。OpenSearch現在運行在一個新的專有存儲層上。“集合可以真正縮小到零,這意味着如果你的資源不活躍,你無需支付任何費用,”White解釋道。“然後它們可以在幾秒鐘內重新啓動,以處理代理的需求,因為我們不希望出現冷啓動問題。”該服務還支持搜索和向量集合類型,按OpenSearch計算單元(OCU)定價,涵蓋索引、搜索和GPU加速。

成本節省60%來自兩個方面:新的專有存儲層及其壓縮功能,以及自動縮放器在流量下降時能迅速降低容量。“由於我們能夠預測你的需求,並且能夠快速交付和縮減,你將自動節省資金,”White説。

White坦言OpenSearch過去存在的問題:“OpenSearch一直是瑞士軍刀,是一個大雜燴。我們去年甚至嘗試轉向SIEM。”但那次嘗試未能持續。現在,OpenSearch圍繞代理工作負載,將傳統搜索與日誌分析相結合。

關於未來路線圖,代理的長期內存功能計劃於2026年下半年推出,內置評估和治理機制。White指出:“評估既是一門藝術也是一門科學。什麼樣的內容應該存儲或清除——這是一個持續的反饋循環。”此外,知識圖譜和語義層的功能也在開發中,以及“針對搜索工作負載的高級推理模型”。

一場重要的日誌分析發佈計劃於6月進行,這將使AWS重返由Datadog、Splunk和Grafana主導的市場。TIMESERIES集合類型將在AWS紐約峯會上推出,以擴展可觀測性工作負載。White還表示:“當精度和令牌優化到位時,人們可能會問LLM能否取代像OpenSearch這樣的東西。”但AWS的答案是,OpenSearch Serverless將成為LLM調用的重要語義層,而非被取代。