AI News HubLIVE
站内改写1 分钟阅读

Show HN: Nightwatch——开源、只读的AI SRE工具

Nightwatch(ninoxAI)是一款开源、只读的AI SRE工具,它从监控工具中摄取告警,将其聚类为事件,利用AI代理调查根本原因,并提出供人类批准的修复建议。它是本地优先且与监控工具无关的。

来源Hacker News AI作者: egorferber

Nightwatch(亦称 ninoxAI)是一款开源的、只读的 AI SRE(站点可靠性工程)工具。它的设计理念是观察、推理并建议,但绝不执行任何操作。当监控系统发出告警风暴时,Nightwatch 能够将这些告警聚类为单一事件,并自动调查根本原因。它支持多种监控工具,如 Checkmk、Prometheus、Icinga2、Zabbix 等,并通过只读适配器收集告警信息。

快速启动:只需复制环境变量文件并运行 Docker Compose,即可在 60 秒内体验。对于没有实时监控的环境,它还可以生成模拟告警进行演示。在后台,Nightwatch 使用工具调用型大语言模型(LLM)驱动只读调查代理,该代理可以访问 Docker、Kubernetes、AWS、Grafana、GitHub 和 Git 等系统,收集实时证据,形成假设,并提出分类修复建议。所有建议都带有风险等级和影响范围,需要人工批准后才能执行。

Nightwatch 的架构包括摄取、标准化、聚类、噪声评分、推荐和调查等阶段。它还支持分布式部署,通过名为“ninox”的轻量级 runner 在隔离环境中运行,只向外发起连接,无需开放入站防火墙端口。每个 runner 持有本地凭据,并向中央大脑报告只读能力。

此外,Nightwatch 支持多种 LLM 提供商,包括本地模板(无需网络)、Mistral、Anthropic 和 OpenAI,可针对不同角色选择不同模型。它内置了秘密清洗和注入防护机制,确保安全。该项目完全开源,采用 Apache 2.0 许可证,可在开源或闭源项目中自由使用、自托管和修改。

Nightwatch 的核心理念是只读安全性:它永远不会执行任何命令,不会更改阈值,也不会写回生产环境。每一个修复建议都是可复制的人工制品,由人类批准后执行。这种设计确保了即使在最敏感的环境中也能安全部署。