2026-05-29 02:30 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

AWS為何徹底重構OpenSearch架構以應對代理工作負載

AWS完全重構了OpenSearch Serverless，分離儲存和計算，支援零成本空閒縮放，成本降低60%，自動縮放速度提升20倍，並針對AI代理的突發工作負載最佳化。新架構包括專有儲存層、GPU加速，並整合Vercel和Kiro IDE。未來將推出代理記憶體、日誌分析（6月）和搜尋推理模型。

來源The New Stack AI作者: Frederic Lardinois

AWS於週四推出了一項重大更新，對其託管搜尋和向量引擎OpenSearch Serverless進行了近乎徹底的重構，以更好地滿足AI代理時代的需求。新一代架構實現了空閒時縮放至零的能力，並且與峰值容量執行時的預置叢集相比，成本可降低高達60%。

這一變革源於AI代理的使用模式——它們往往以突發方式出現，伴隨長時間的空閒期，這本質上打破了原始無伺服器架構的假設。OpenSearch的總經理Tia White（於2月上任）向The New Stack表示：“大約97%的程式碼由託管服務的工程師從零開始構建。大部分是徹底的重構。其餘部分來自開源倉庫，但任何真正的新穎或智慧財產權部分都不會開源。”

最重大的架構變化是儲存和計算的分離。OpenSearch現在執行在一個新的專有儲存層上。“集合可以真正縮小到零，這意味著如果你的資源不活躍，你無需支付任何費用，”White解釋道。“然後它們可以在幾秒鐘內重新啟動，以處理代理的需求，因為我們不希望出現冷啟動問題。”該服務還支援搜尋和向量集合型別，按OpenSearch計算單元（OCU）定價，涵蓋索引、搜尋和GPU加速。

成本節省60%來自兩個方面：新的專有儲存層及其壓縮功能，以及自動縮放器在流量下降時能迅速降低容量。“由於我們能夠預測你的需求，並且能夠快速交付和縮減，你將自動節省資金，”White說。

White坦言OpenSearch過去存在的問題：“OpenSearch一直是瑞士軍刀，是一個大雜燴。我們去年甚至嘗試轉向SIEM。”但那次嘗試未能持續。現在，OpenSearch圍繞代理工作負載，將傳統搜尋與日誌分析相結合。

關於未來路線圖，代理的長期記憶體功能計劃於2026年下半年推出，內建評估和治理機制。White指出：“評估既是一門藝術也是一門科學。什麼樣的內容應該儲存或清除——這是一個持續的反饋迴圈。”此外，知識圖譜和語義層的功能也在開發中，以及“針對搜尋工作負載的高階推理模型”。

一場重要的日誌分析釋出計劃於6月進行，這將使AWS重返由Datadog、Splunk和Grafana主導的市場。TIMESERIES集合型別將在AWS紐約峰會上推出，以擴充套件可觀測性工作負載。White還表示：“當精度和令牌最佳化到位時，人們可能會問LLM能否取代像OpenSearch這樣的東西。”但AWS的答案是，OpenSearch Serverless將成為LLM呼叫的重要語義層，而非被取代。