AI News HubLIVE
站内改写2 分钟阅读

面向金融合规的生产级AI代理:来自Stripe的经验教训

Stripe每年处理1.4万亿美元支付量,通过基于Amazon Bedrock的ReAct代理框架,将合规审查处理时间减少26%,同时保持人工监督。本文介绍其技术架构、基础设施决策以及部署AI代理的经验教训,包括任务分解、编排模式和通过提示缓存优化成本。

来源AWS Machine Learning Blog作者: Christopher Phillippi

Stripe作为全球支付基础设施的领导者,每年处理约1.4万亿美元的交易量,横跨50个国家,这相当于全球GDP的约1.3%。如此庞大的规模带来了巨大的合规挑战:每天有数千笔交易需要审查,而人工分析员花费高达80%的时间在碎片化的系统中搜集文件,而非进行高价值的风险评估。

为了解决这一问题,Stripe在AWS上基于Amazon Bedrock构建了一套生产级的AI代理系统。该系统采用ReAct(推理与行动)代理框架,将复杂的合规审查分解为多个可组合的子任务,每个子任务形成一个有向无环图(DAG)。这种分解方式不仅让代理专注于特定问题,还确保了审查的全面性和可审计性。Stripe的合规审查流程基于三个支柱:监督与问责、透明度和效率。监督与问责意味着人类始终处于驾驶位置,配置可审批的工作流和多层决策检查点。透明度要求每一步行动、决策和理由都有不可篡改的审计跟踪。效率通过预调查和动态分析实现更深入的审查。

在实际应用中,AI代理并不直接做出最终决定,而是为人类审查员提供预调查的研究结果。审查员在工具中逐一回答子问题,代理的回答作为补充信息,但仍由人类掌握最终决策权。这种设计实现了96%以上的有用性评级,同时保持了必要的监督和问责。

在ReAct框架中,代理在每次思考后可以调用工具获取数据,然后处理观测结果。这形成了一个闭环控制系统,防止幻觉和推理偏离。为了处理长上下文,Stripe采用子任务分解限制交互轮次,并使用Amazon Bedrock的提示缓存降低输入令牌成本。

技术架构上,Stripe构建了专用的代理服务来处理代理逻辑,这与传统的机器学习推理引擎截然不同。代理应用主要是网络密集型,等待模型响应和工具调用,而非计算密集型。此外,Stripe还开发了LLM代理微服务,提供统一的API接口、模型降级和监控功能,避免了多团队间的资源争用。LLM代理解决了噪声邻居问题,提供单一API访问多种模型,并支持自动降级。

整个系统从最初寥寥几个代理迅速增长到超过100个代理,覆盖了多种合规场景。Stripe的经验表明,通过合理的任务分解、人工监督和专用基础设施,AI代理能够有效扩展合规操作,同时保证质量和可审计性。这一方法为金融行业应对全球2060亿美元的合规负担提供了可借鉴的路径。