AWS为何彻底重构OpenSearch架构以应对代理工作负载
AWS完全重构了OpenSearch Serverless,分离存储和计算,支持零成本空闲缩放,成本降低60%,自动缩放速度提升20倍,并针对AI代理的突发工作负载优化。新架构包括专有存储层、GPU加速,并整合Vercel和Kiro IDE。未来将推出代理内存、日志分析(6月)和搜索推理模型。
文章情报
要点
- AWS对OpenSearch Serverless进行了近97%的重构,分离存储和计算,实现空闲时缩放至零。
- 新架构针对AI代理的突发工作负载,自动缩放速度提升20倍,成本降低60%。
- 支持搜索和向量集合,集成Vercel、Kiro IDE及多种Agent Skills。
- 路线图包括代理长期内存(2026年)、日志分析(6月)和搜索推理模型。
为什么重要
这条新闻值得关注,因为AWS对OpenSearch Serverless进行了近97%的重构,分离存储和计算,实现空闲时缩放至零。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
AWS于周四推出了一项重大更新,对其托管搜索和向量引擎OpenSearch Serverless进行了近乎彻底的重构,以更好地满足AI代理时代的需求。新一代架构实现了空闲时缩放至零的能力,并且与峰值容量运行时的预置集群相比,成本可降低高达60%。
这一变革源于AI代理的使用模式——它们往往以突发方式出现,伴随长时间的空闲期,这本质上打破了原始无服务器架构的假设。OpenSearch的总经理Tia White(于2月上任)向The New Stack表示:“大约97%的代码由托管服务的工程师从零开始构建。大部分是彻底的重构。其余部分来自开源仓库,但任何真正的新颖或知识产权部分都不会开源。”
最重大的架构变化是存储和计算的分离。OpenSearch现在运行在一个新的专有存储层上。“集合可以真正缩小到零,这意味着如果你的资源不活跃,你无需支付任何费用,”White解释道。“然后它们可以在几秒钟内重新启动,以处理代理的需求,因为我们不希望出现冷启动问题。”该服务还支持搜索和向量集合类型,按OpenSearch计算单元(OCU)定价,涵盖索引、搜索和GPU加速。
成本节省60%来自两个方面:新的专有存储层及其压缩功能,以及自动缩放器在流量下降时能迅速降低容量。“由于我们能够预测你的需求,并且能够快速交付和缩减,你将自动节省资金,”White说。
White坦言OpenSearch过去存在的问题:“OpenSearch一直是瑞士军刀,是一个大杂烩。我们去年甚至尝试转向SIEM。”但那次尝试未能持续。现在,OpenSearch围绕代理工作负载,将传统搜索与日志分析相结合。
关于未来路线图,代理的长期内存功能计划于2026年下半年推出,内置评估和治理机制。White指出:“评估既是一门艺术也是一门科学。什么样的内容应该存储或清除——这是一个持续的反馈循环。”此外,知识图谱和语义层的功能也在开发中,以及“针对搜索工作负载的高级推理模型”。
一场重要的日志分析发布计划于6月进行,这将使AWS重返由Datadog、Splunk和Grafana主导的市场。TIMESERIES集合类型将在AWS纽约峰会上推出,以扩展可观测性工作负载。White还表示:“当精度和令牌优化到位时,人们可能会问LLM能否取代像OpenSearch这样的东西。”但AWS的答案是,OpenSearch Serverless将成为LLM调用的重要语义层,而非被取代。