2026-05-29 02:30 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

AWS為何徹底重構OpenSearch架構以應對代理工作負載

AWS完全重構了OpenSearch Serverless，分離存儲和計算，支持零成本空閒縮放，成本降低60%，自動縮放速度提升20倍，並針對AI代理的突發工作負載優化。新架構包括專有存儲層、GPU加速，並整合Vercel和Kiro IDE。未來將推出代理內存、日誌分析（6月）和搜索推理模型。

來源The New Stack AI作者: Frederic Lardinois

AWS於週四推出了一項重大更新，對其託管搜索和向量引擎OpenSearch Serverless進行了近乎徹底的重構，以更好地滿足AI代理時代的需求。新一代架構實現了空閒時縮放至零的能力，並且與峯值容量運行時的預置集羣相比，成本可降低高達60%。

這一變革源於AI代理的使用模式——它們往往以突發方式出現，伴隨長時間的空閒期，這本質上打破了原始無服務器架構的假設。OpenSearch的總經理Tia White（於2月上任）向The New Stack表示：“大約97%的代碼由託管服務的工程師從零開始構建。大部分是徹底的重構。其餘部分來自開源倉庫，但任何真正的新穎或知識產權部分都不會開源。”

最重大的架構變化是存儲和計算的分離。OpenSearch現在運行在一個新的專有存儲層上。“集合可以真正縮小到零，這意味着如果你的資源不活躍，你無需支付任何費用，”White解釋道。“然後它們可以在幾秒鐘內重新啓動，以處理代理的需求，因為我們不希望出現冷啓動問題。”該服務還支持搜索和向量集合類型，按OpenSearch計算單元（OCU）定價，涵蓋索引、搜索和GPU加速。

成本節省60%來自兩個方面：新的專有存儲層及其壓縮功能，以及自動縮放器在流量下降時能迅速降低容量。“由於我們能夠預測你的需求，並且能夠快速交付和縮減，你將自動節省資金，”White説。

White坦言OpenSearch過去存在的問題：“OpenSearch一直是瑞士軍刀，是一個大雜燴。我們去年甚至嘗試轉向SIEM。”但那次嘗試未能持續。現在，OpenSearch圍繞代理工作負載，將傳統搜索與日誌分析相結合。

關於未來路線圖，代理的長期內存功能計劃於2026年下半年推出，內置評估和治理機制。White指出：“評估既是一門藝術也是一門科學。什麼樣的內容應該存儲或清除——這是一個持續的反饋循環。”此外，知識圖譜和語義層的功能也在開發中，以及“針對搜索工作負載的高級推理模型”。

一場重要的日誌分析發佈計劃於6月進行，這將使AWS重返由Datadog、Splunk和Grafana主導的市場。TIMESERIES集合類型將在AWS紐約峯會上推出，以擴展可觀測性工作負載。White還表示：“當精度和令牌優化到位時，人們可能會問LLM能否取代像OpenSearch這樣的東西。”但AWS的答案是，OpenSearch Serverless將成為LLM調用的重要語義層，而非被取代。