西班牙桑坦德银行开源AI项目
桑坦德银行AI实验室发布了一系列开源AI工具,专注于小型模型、工程、智能体、负责任AI、MLOps和图机器学习在金融服务中的应用。特色项目包括Ralph、Auto-Bayesian、AutoGuardrails、Causal Perception、Gen-Fraud-Graph等,均采用Apache-2.0许可。
桑坦德银行AI实验室(Banco Santander AI Lab)近期在GitHub上开源了多个AI项目,旨在推动金融服务业中小型模型、工程化、智能体演进、负责任AI、MLOps和图机器学习的发展。这些项目均采用Apache-2.0许可协议,使用合成或匿名化数据,不涉及任何真实客户信息。
主要项目包括:
- ralph:一个可配置的Bash/PowerShell循环,每次迭代运行新的AI编码CLI会话,用于自动化编码任务。
- auto-bayesian:基于配置的、可解释的贝叶斯网络训练工具,适用于关系型表格数据。
- autoguardrails:对齐研究框架,用于LLM护栏,通过单一的policy.md文件实现。
- causal-perception-implementation:用于因果感知的机器学习研究代码,通过干预分布和反事实分布比较竞争的结构因果模型,应用于公平信贷决策。
- gen-fraud-graph:合成欺诈图生成器,用于训练和基准测试基于图的欺诈检测模型,可扩展到1亿+账户。
- genetic-algorithm:无依赖的Python遗传算法引擎,具有可插拔的适应度标准,可作为LLM/AI自动研究器的可复用搜索核心。
- linear-adapter-trainer:使用三元组损失训练线性嵌入适配器,以对齐检索嵌入与查询(RAG)。
- llm_bridge:小型、供应商中立的LLM客户端库,通过统一接口支持OpenAI、AWS Bedrock、Google Gemini等,或自定义后端。
- mech-gov-framework:LLM决策的机械治理框架,提供模型无关的治理制度、硬门控和治理指标,适用于高风险LLM决策系统。
- mutatis-mutandis:歧视分析中的情景测试,使用反事实比较器,是论文《Mutatis Mutandis: Revisiting the Comparator in Discrimination Testing》的研究代码。
- sota-stressed-datasets:以压力形式重新发布的开放基准数据集,用于评估ML/LLM的鲁棒性,由桑坦德AI实验室策划。
此外,实验室还推出了ralph-vault-skill、.github等辅助项目。
所有项目在公开发布前都经过开源计划办公室(OSPO)的透明两轨审查。快速通道适用于分叉、通用工具、教程、数据集和无业务逻辑的SDK,由OSPO负责人审查并自动扫描。标准通道适用于模型、算法、核心库、涉及数据科学或业务逻辑的组件,需要更严格的法律、安全、隐私和数据保护评估。
桑坦德银行通过这一系列开源项目,不仅提升了银行业可信AI的标准,也回馈了支持其创新的开源社区。