AWS賬單為何飆升?現在有智慧代理來解答
AWS推出FinOps代理,以自然語言互動分析雲成本、識別異常、自動建立工單,幫助團隊從週期性審查轉向持續最佳化。
亞馬遜雲服務(AWS)近日為其日益壯大的AI工具集增添了第三款專門面向IT運營的“前沿代理”——FinOps代理。該工具專注於雲賬單管理,已於上週進入公開預覽階段。此前,AWS已推出安全代理和DevOps代理。FinOps代理的誕生,旨在將傳統上依賴儀表板、電子表格和人工分析師的領域,交由一個能夠以自然語言提問並自主識別問題的智慧代理處理。
FinOps(雲財務運營)是一門促使工程、財務和業務團隊共同為雲支出負責的學科。AWS將新代理定位為對已發生的趨勢的響應:FinOps工作正從定期的儀表板驅動審查,轉向持續執行在工程團隊已使用的工具(如Jira和Slack)中的工作流。
該代理的核心工作流程從AWS成本異常檢測的終點開始。當前,異常警報僅告知團隊有變化,但不說明具體變化和原因。FinOps代理則能進一步將成本飆升與AWS CloudTrail中記錄的人員、變更和時間關聯,識別觸發變更,並生成調查摘要,指出可能的原因和責任人。隨後,它可自動在Jira中建立工單或向Slack頻道傳送訊息。
代理還能回答自然語言成本問題,例如“為什麼我上個月的AWS成本增加了?”它從Cost Explorer、Cost Optimization Hub和Compute Optimizer中提取資料,並將答案關聯到具體服務和用量驅動因素。組織可上傳上下文檔案,將賬戶對映到所有者、團隊和標籤約定,以便代理將例如“團隊X的成本是多少”這樣的問題翻譯成正確的賬戶集合。
公開預覽版還新增了定期成本報告功能(可按日、周或月生成,匯出為HTML、PDF或PPT),以及將Cost Optimization Hub和Compute Optimizer的建議打包成Jira工單以便工程師直接處理的功能。
在許可權方面,AWS對該代理的訪問進行了嚴格限制。據文件描述,FinOps代理使用的IAM角色主要為只讀許可權,涵蓋賬單、最佳化、監控、日誌記錄和基礎設施服務——足以分析成本、調查異常和發現節省機會,但無法觸及資源本身。唯一寫入許可權是管理代理自身的EventBridge排程規則,用於驅動其定期自動化任務。它無法建立、修改或刪除EC2例項、RDS資料庫、Lambda函式或網路元件。該代理基於Amazon Bedrock構建,AWS表示其包含了標準自動化濫用檢測防護措施。
AWS的公告中提到了四個客戶案例,各自描述了不同的痛點。Workday的AI平臺基礎設施團隊執行著跨多個AWS賬戶的AI平臺,其軟體開發工程經理Serjesh Sharma表示,該代理能將兩個耗時任務——在成本異常成為預算問題前追蹤根因,以及彙總月度報告供領導層審閱——整合到一個自然語言介面中。紐西蘭最大的家裝零售商Mitre 10的平臺工程經理Eduard Kleynhans指出,定期成本審查和異常檢查歷來與可靠性和改進工作“直接競爭”,而代理的價值在於讓這些檢查“持續在後臺執行”,僅在有真正值得關注的問題時才會呈現發現。商業支付公司Convera的基礎設施工程和運營負責人Ramesh Singaraj提到,小規模的意外成本變更常常在共享佇列中被忽略,代理的優勢在於能將Jira工單路由到“擁有該資源的工程團隊,從而讓正確的工程師看到,而不是無人關注的共享佇列”。AVIV Group在法國、德國和比利時運營數字房地產平臺,擁有數百個AWS賬戶,其FinOps總監Jordi Espasa表示,代理可以處理一線問題,例如按需與Savings Plan定價的區別或特定異常的原因,從而讓中央FinOps團隊專注於“計費邏輯、最佳化策略和領導層報告”。
目前,該公開預覽僅在美國東部(弗吉尼亞北部)區域提供,但可從管理賬戶部署以管理其他AWS區域和賬戶的成本與用量資料(GovCloud以及北京/寧夏中國區域除外)。預覽期間免費使用,但有月度用量限制,不過代理涉及的其他AWS服務仍按標準收費。AWS表示,代理將逐步擴充套件功能,包括專門針對AI工作負載的成本分析。鑑於AI基礎設施支出正成為FinOps團隊需要解釋的最大專案之一,這一點尤為值得關注。