OpenDevOps – 一款开源AI代理,用于调查AWS/Azure事件
OpenDevOps是一款开源的多云DevOps代理,支持AWS和Azure,可接入任何LLM(通过LiteLLM),用于调查云事件、查找根本原因并提供缓解方案。它比AWS DevOps Agent便宜约10倍,且支持自托管、数据本地化、可审计和高度定制。
OpenDevOps是一个开源的多云DevOps代理,专为调查AWS和Azure云环境中的事件而设计。它利用LiteLLM集成任何大型语言模型(LLM),包括OpenAI、Anthropic、OpenRouter、Groq、Gemini、Mistral,以及用于气隙或受监管环境的本地Ollama。该工具还能自动检测现有的Claude Code订阅,从而将增量LLM成本降至零。
在包含10个真实AWS和Azure资源的可复现基准测试中,OpenDevOps表现出色:它成功找到了90%(9/10)的根本原因,中位时间仅52秒,每次调查成本约0.03美元。相比之下,这比AWS DevOps Agent便宜约10倍,比手动分类(估计20-40分钟的工程师时间)便宜约1000倍。这些基准测试使用了商品化开放模型(gpt-oss-120b),无需前沿模型。
OpenDevOps的架构基于LangChain DeepAgents框架,提供21个只读AWS工具(覆盖CloudWatch、CloudTrail、ECS、Lambda、EC2、RDS和IAM),以及Azure CLI支持(通过只读az CLI和kubectl)。它还包括一个沙盒bash执行工具,用于运行白名单命令,并具有严格的超时和安全保护。事件驱动检测通过EventBridge→SQS→长轮询消费者实现,涵盖9种事件类型。系统提供Web UI(React + Vite + FastAPI),包括聊天界面、监控仪表板、会话历史、搜索和设置等页面。
该工具强调数据主权:所有调查、提示和工具输出都持久化在用户自己的Postgres或SQLite数据库中,支持HIPAA、PCI、FedRAMP和EU AI Act审计要求。每个提示、工具调用和令牌都公开可见,完全可审计。用户可以通过添加Python函数工具、放置SKILL.md运行手册或修改系统提示来定制代理。
部署快速:支持Docker Compose、本地开发或Railway。依赖管理通过uv sync完成,环境配置简单。OpenDevOps还提供CLI工具,支持“investigate”、“ask”和“report”命令,以及内置的MCP服务器,可从Claude Desktop、Cursor或其他MCP客户端使用。
对于完全依赖AWS且不需要自托管基础设施的用户,Amazon Q Developer可能是更合适的选择。但OpenDevOps为需要多云灵活性、数据本地化、定制性和成本控制的用户提供了强大的开源替代方案。