2026-05-29 02:30 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

AWS为何彻底重构OpenSearch架构以应对代理工作负载

AWS完全重构了OpenSearch Serverless，分离存储和计算，支持零成本空闲缩放，成本降低60%，自动缩放速度提升20倍，并针对AI代理的突发工作负载优化。新架构包括专有存储层、GPU加速，并整合Vercel和Kiro IDE。未来将推出代理内存、日志分析（6月）和搜索推理模型。

来源The New Stack AI作者: Frederic Lardinois

AWS于周四推出了一项重大更新，对其托管搜索和向量引擎OpenSearch Serverless进行了近乎彻底的重构，以更好地满足AI代理时代的需求。新一代架构实现了空闲时缩放至零的能力，并且与峰值容量运行时的预置集群相比，成本可降低高达60%。

这一变革源于AI代理的使用模式——它们往往以突发方式出现，伴随长时间的空闲期，这本质上打破了原始无服务器架构的假设。OpenSearch的总经理Tia White（于2月上任）向The New Stack表示：“大约97%的代码由托管服务的工程师从零开始构建。大部分是彻底的重构。其余部分来自开源仓库，但任何真正的新颖或知识产权部分都不会开源。”

最重大的架构变化是存储和计算的分离。OpenSearch现在运行在一个新的专有存储层上。“集合可以真正缩小到零，这意味着如果你的资源不活跃，你无需支付任何费用，”White解释道。“然后它们可以在几秒钟内重新启动，以处理代理的需求，因为我们不希望出现冷启动问题。”该服务还支持搜索和向量集合类型，按OpenSearch计算单元（OCU）定价，涵盖索引、搜索和GPU加速。

成本节省60%来自两个方面：新的专有存储层及其压缩功能，以及自动缩放器在流量下降时能迅速降低容量。“由于我们能够预测你的需求，并且能够快速交付和缩减，你将自动节省资金，”White说。

White坦言OpenSearch过去存在的问题：“OpenSearch一直是瑞士军刀，是一个大杂烩。我们去年甚至尝试转向SIEM。”但那次尝试未能持续。现在，OpenSearch围绕代理工作负载，将传统搜索与日志分析相结合。

关于未来路线图，代理的长期内存功能计划于2026年下半年推出，内置评估和治理机制。White指出：“评估既是一门艺术也是一门科学。什么样的内容应该存储或清除——这是一个持续的反馈循环。”此外，知识图谱和语义层的功能也在开发中，以及“针对搜索工作负载的高级推理模型”。

一场重要的日志分析发布计划于6月进行，这将使AWS重返由Datadog、Splunk和Grafana主导的市场。TIMESERIES集合类型将在AWS纽约峰会上推出，以扩展可观测性工作负载。White还表示：“当精度和令牌优化到位时，人们可能会问LLM能否取代像OpenSearch这样的东西。”但AWS的答案是，OpenSearch Serverless将成为LLM调用的重要语义层，而非被取代。