2026-06-08 04:24 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

Show HN: Nightwatch——开源、只读的AI SRE工具

Nightwatch（ninoxAI）是一款开源、只读的AI SRE工具，它从监控工具中摄取告警，将其聚类为事件，利用AI代理调查根本原因，并提出供人类批准的修复建议。它是本地优先且与监控工具无关的。

来源Hacker News AI作者: egorferber

Nightwatch（亦称 ninoxAI）是一款开源的、只读的 AI SRE（站点可靠性工程）工具。它的设计理念是观察、推理并建议，但绝不执行任何操作。当监控系统发出告警风暴时，Nightwatch 能够将这些告警聚类为单一事件，并自动调查根本原因。它支持多种监控工具，如 Checkmk、Prometheus、Icinga2、Zabbix 等，并通过只读适配器收集告警信息。

快速启动：只需复制环境变量文件并运行 Docker Compose，即可在 60 秒内体验。对于没有实时监控的环境，它还可以生成模拟告警进行演示。在后台，Nightwatch 使用工具调用型大语言模型（LLM）驱动只读调查代理，该代理可以访问 Docker、Kubernetes、AWS、Grafana、GitHub 和 Git 等系统，收集实时证据，形成假设，并提出分类修复建议。所有建议都带有风险等级和影响范围，需要人工批准后才能执行。

Nightwatch 的架构包括摄取、标准化、聚类、噪声评分、推荐和调查等阶段。它还支持分布式部署，通过名为“ninox”的轻量级 runner 在隔离环境中运行，只向外发起连接，无需开放入站防火墙端口。每个 runner 持有本地凭据，并向中央大脑报告只读能力。

此外，Nightwatch 支持多种 LLM 提供商，包括本地模板（无需网络）、Mistral、Anthropic 和 OpenAI，可针对不同角色选择不同模型。它内置了秘密清洗和注入防护机制，确保安全。该项目完全开源，采用 Apache 2.0 许可证，可在开源或闭源项目中自由使用、自托管和修改。

Nightwatch 的核心理念是只读安全性：它永远不会执行任何命令，不会更改阈值，也不会写回生产环境。每一个修复建议都是可复制的人工制品，由人类批准后执行。这种设计确保了即使在最敏感的环境中也能安全部署。