AWS账单为何飙升?现在有智能代理来解答
AWS推出FinOps代理,以自然语言交互分析云成本、识别异常、自动创建工单,帮助团队从周期性审查转向持续优化。
亚马逊云服务(AWS)近日为其日益壮大的AI工具集增添了第三款专门面向IT运营的“前沿代理”——FinOps代理。该工具专注于云账单管理,已于上周进入公开预览阶段。此前,AWS已推出安全代理和DevOps代理。FinOps代理的诞生,旨在将传统上依赖仪表板、电子表格和人工分析师的领域,交由一个能够以自然语言提问并自主识别问题的智能代理处理。
FinOps(云财务运营)是一门促使工程、财务和业务团队共同为云支出负责的学科。AWS将新代理定位为对已发生的趋势的响应:FinOps工作正从定期的仪表板驱动审查,转向持续运行在工程团队已使用的工具(如Jira和Slack)中的工作流。
该代理的核心工作流程从AWS成本异常检测的终点开始。当前,异常警报仅告知团队有变化,但不说明具体变化和原因。FinOps代理则能进一步将成本飙升与AWS CloudTrail中记录的人员、变更和时间关联,识别触发变更,并生成调查摘要,指出可能的原因和责任人。随后,它可自动在Jira中创建工单或向Slack频道发送消息。
代理还能回答自然语言成本问题,例如“为什么我上个月的AWS成本增加了?”它从Cost Explorer、Cost Optimization Hub和Compute Optimizer中提取数据,并将答案关联到具体服务和用量驱动因素。组织可上传上下文文件,将账户映射到所有者、团队和标签约定,以便代理将例如“团队X的成本是多少”这样的问题翻译成正确的账户集合。
公开预览版还新增了定期成本报告功能(可按日、周或月生成,导出为HTML、PDF或PPT),以及将Cost Optimization Hub和Compute Optimizer的建议打包成Jira工单以便工程师直接处理的功能。
在权限方面,AWS对该代理的访问进行了严格限制。据文档描述,FinOps代理使用的IAM角色主要为只读权限,涵盖账单、优化、监控、日志记录和基础设施服务——足以分析成本、调查异常和发现节省机会,但无法触及资源本身。唯一写入权限是管理代理自身的EventBridge调度规则,用于驱动其定期自动化任务。它无法创建、修改或删除EC2实例、RDS数据库、Lambda函数或网络组件。该代理基于Amazon Bedrock构建,AWS表示其包含了标准自动化滥用检测防护措施。
AWS的公告中提到了四个客户案例,各自描述了不同的痛点。Workday的AI平台基础设施团队运行着跨多个AWS账户的AI平台,其软件开发工程经理Serjesh Sharma表示,该代理能将两个耗时任务——在成本异常成为预算问题前追踪根因,以及汇总月度报告供领导层审阅——整合到一个自然语言界面中。新西兰最大的家装零售商Mitre 10的平台工程经理Eduard Kleynhans指出,定期成本审查和异常检查历来与可靠性和改进工作“直接竞争”,而代理的价值在于让这些检查“持续在后台运行”,仅在有真正值得关注的问题时才会呈现发现。商业支付公司Convera的基础设施工程和运营负责人Ramesh Singaraj提到,小规模的意外成本变更常常在共享队列中被忽略,代理的优势在于能将Jira工单路由到“拥有该资源的工程团队,从而让正确的工程师看到,而不是无人关注的共享队列”。AVIV Group在法国、德国和比利时运营数字房地产平台,拥有数百个AWS账户,其FinOps总监Jordi Espasa表示,代理可以处理一线问题,例如按需与Savings Plan定价的区别或特定异常的原因,从而让中央FinOps团队专注于“计费逻辑、优化策略和领导层报告”。
目前,该公开预览仅在美国东部(弗吉尼亚北部)区域提供,但可从管理账户部署以管理其他AWS区域和账户的成本与用量数据(GovCloud以及北京/宁夏中国区域除外)。预览期间免费使用,但有月度用量限制,不过代理涉及的其他AWS服务仍按标准收费。AWS表示,代理将逐步扩展功能,包括专门针对AI工作负载的成本分析。鉴于AI基础设施支出正成为FinOps团队需要解释的最大项目之一,这一点尤为值得关注。