AWS賬單為何飆升?現在有智能代理來解答
AWS推出FinOps代理,以自然語言交互分析雲成本、識別異常、自動創建工單,幫助團隊從週期性審查轉向持續優化。
亞馬遜雲服務(AWS)近日為其日益壯大的AI工具集增添了第三款專門面向IT運營的“前沿代理”——FinOps代理。該工具專注於雲賬單管理,已於上週進入公開預覽階段。此前,AWS已推出安全代理和DevOps代理。FinOps代理的誕生,旨在將傳統上依賴儀表板、電子表格和人工分析師的領域,交由一個能夠以自然語言提問並自主識別問題的智能代理處理。
FinOps(雲財務運營)是一門促使工程、財務和業務團隊共同為雲支出負責的學科。AWS將新代理定位為對已發生的趨勢的響應:FinOps工作正從定期的儀表板驅動審查,轉向持續運行在工程團隊已使用的工具(如Jira和Slack)中的工作流。
該代理的核心工作流程從AWS成本異常檢測的終點開始。當前,異常警報僅告知團隊有變化,但不説明具體變化和原因。FinOps代理則能進一步將成本飆升與AWS CloudTrail中記錄的人員、變更和時間關聯,識別觸發變更,並生成調查摘要,指出可能的原因和責任人。隨後,它可自動在Jira中創建工單或向Slack頻道發送消息。
代理還能回答自然語言成本問題,例如“為什麼我上個月的AWS成本增加了?”它從Cost Explorer、Cost Optimization Hub和Compute Optimizer中提取數據,並將答案關聯到具體服務和用量驅動因素。組織可上傳上下文文件,將賬户映射到所有者、團隊和標籤約定,以便代理將例如“團隊X的成本是多少”這樣的問題翻譯成正確的賬户集合。
公開預覽版還新增了定期成本報告功能(可按日、周或月生成,導出為HTML、PDF或PPT),以及將Cost Optimization Hub和Compute Optimizer的建議打包成Jira工單以便工程師直接處理的功能。
在權限方面,AWS對該代理的訪問進行了嚴格限制。據文檔描述,FinOps代理使用的IAM角色主要為只讀權限,涵蓋賬單、優化、監控、日誌記錄和基礎設施服務——足以分析成本、調查異常和發現節省機會,但無法觸及資源本身。唯一寫入權限是管理代理自身的EventBridge調度規則,用於驅動其定期自動化任務。它無法創建、修改或刪除EC2實例、RDS數據庫、Lambda函數或網絡組件。該代理基於Amazon Bedrock構建,AWS表示其包含了標準自動化濫用檢測防護措施。
AWS的公告中提到了四個客户案例,各自描述了不同的痛點。Workday的AI平台基礎設施團隊運行着跨多個AWS賬户的AI平台,其軟件開發工程經理Serjesh Sharma表示,該代理能將兩個耗時任務——在成本異常成為預算問題前追蹤根因,以及彙總月度報告供領導層審閲——整合到一個自然語言界面中。新西蘭最大的家裝零售商Mitre 10的平台工程經理Eduard Kleynhans指出,定期成本審查和異常檢查歷來與可靠性和改進工作“直接競爭”,而代理的價值在於讓這些檢查“持續在後台運行”,僅在有真正值得關注的問題時才會呈現發現。商業支付公司Convera的基礎設施工程和運營負責人Ramesh Singaraj提到,小規模的意外成本變更常常在共享隊列中被忽略,代理的優勢在於能將Jira工單路由到“擁有該資源的工程團隊,從而讓正確的工程師看到,而不是無人關注的共享隊列”。AVIV Group在法國、德國和比利時運營數字房地產平台,擁有數百個AWS賬户,其FinOps總監Jordi Espasa表示,代理可以處理一線問題,例如按需與Savings Plan定價的區別或特定異常的原因,從而讓中央FinOps團隊專注於“計費邏輯、優化策略和領導層報告”。
目前,該公開預覽僅在美國東部(弗吉尼亞北部)區域提供,但可從管理賬户部署以管理其他AWS區域和賬户的成本與用量數據(GovCloud以及北京/寧夏中國區域除外)。預覽期間免費使用,但有月度用量限制,不過代理涉及的其他AWS服務仍按標準收費。AWS表示,代理將逐步擴展功能,包括專門針對AI工作負載的成本分析。鑑於AI基礎設施支出正成為FinOps團隊需要解釋的最大項目之一,這一點尤為值得關注。