2026-06-26 22:38 UTC+8站内改写2 分钟阅读更新: 2026-06-26 22:41 UTC+8

面向金融合规的生产级AI代理：来自Stripe的经验教训

Stripe每年处理1.4万亿美元支付量，通过基于Amazon Bedrock的ReAct代理框架，将合规审查处理时间减少26%，同时保持人工监督。本文介绍其技术架构、基础设施决策以及部署AI代理的经验教训，包括任务分解、编排模式和通过提示缓存优化成本。

来源AWS Machine Learning Blog作者: Christopher Phillippi

Stripe作为全球支付基础设施的领导者，每年处理约1.4万亿美元的交易量，横跨50个国家，这相当于全球GDP的约1.3%。如此庞大的规模带来了巨大的合规挑战：每天有数千笔交易需要审查，而人工分析员花费高达80%的时间在碎片化的系统中搜集文件，而非进行高价值的风险评估。

为了解决这一问题，Stripe在AWS上基于Amazon Bedrock构建了一套生产级的AI代理系统。该系统采用ReAct（推理与行动）代理框架，将复杂的合规审查分解为多个可组合的子任务，每个子任务形成一个有向无环图（DAG）。这种分解方式不仅让代理专注于特定问题，还确保了审查的全面性和可审计性。Stripe的合规审查流程基于三个支柱：监督与问责、透明度和效率。监督与问责意味着人类始终处于驾驶位置，配置可审批的工作流和多层决策检查点。透明度要求每一步行动、决策和理由都有不可篡改的审计跟踪。效率通过预调查和动态分析实现更深入的审查。

在实际应用中，AI代理并不直接做出最终决定，而是为人类审查员提供预调查的研究结果。审查员在工具中逐一回答子问题，代理的回答作为补充信息，但仍由人类掌握最终决策权。这种设计实现了96%以上的有用性评级，同时保持了必要的监督和问责。

在ReAct框架中，代理在每次思考后可以调用工具获取数据，然后处理观测结果。这形成了一个闭环控制系统，防止幻觉和推理偏离。为了处理长上下文，Stripe采用子任务分解限制交互轮次，并使用Amazon Bedrock的提示缓存降低输入令牌成本。

技术架构上，Stripe构建了专用的代理服务来处理代理逻辑，这与传统的机器学习推理引擎截然不同。代理应用主要是网络密集型，等待模型响应和工具调用，而非计算密集型。此外，Stripe还开发了LLM代理微服务，提供统一的API接口、模型降级和监控功能，避免了多团队间的资源争用。LLM代理解决了噪声邻居问题，提供单一API访问多种模型，并支持自动降级。

整个系统从最初寥寥几个代理迅速增长到超过100个代理，覆盖了多种合规场景。Stripe的经验表明，通过合理的任务分解、人工监督和专用基础设施，AI代理能够有效扩展合规操作，同时保证质量和可审计性。这一方法为金融行业应对全球2060亿美元的合规负担提供了可借鉴的路径。