AI News HubLIVE
站内改写1 分鐘閱讀

Show HN: Nightwatch——開源、只讀的AI SRE工具

Nightwatch(ninoxAI)是一款開源、只讀的AI SRE工具,它從監控工具中攝取告警,將其聚類為事件,利用AI代理調查根本原因,並提出供人類批准的修復建議。它是本地優先且與監控工具無關的。

來源Hacker News AI作者: egorferber

Nightwatch(亦稱 ninoxAI)是一款開源的、只讀的 AI SRE(站點可靠性工程)工具。它的設計理念是觀察、推理並建議,但絕不執行任何操作。當監控系統發出告警風暴時,Nightwatch 能夠將這些告警聚類為單一事件,並自動調查根本原因。它支持多種監控工具,如 Checkmk、Prometheus、Icinga2、Zabbix 等,並通過只讀適配器收集告警信息。

快速啓動:只需複製環境變量文件並運行 Docker Compose,即可在 60 秒內體驗。對於沒有實時監控的環境,它還可以生成模擬告警進行演示。在後台,Nightwatch 使用工具調用型大語言模型(LLM)驅動只讀調查代理,該代理可以訪問 Docker、Kubernetes、AWS、Grafana、GitHub 和 Git 等系統,收集實時證據,形成假設,並提出分類修復建議。所有建議都帶有風險等級和影響範圍,需要人工批准後才能執行。

Nightwatch 的架構包括攝取、標準化、聚類、噪聲評分、推薦和調查等階段。它還支持分佈式部署,通過名為“ninox”的輕量級 runner 在隔離環境中運行,只向外發起連接,無需開放入站防火牆端口。每個 runner 持有本地憑據,並向中央大腦報告只讀能力。

此外,Nightwatch 支持多種 LLM 提供商,包括本地模板(無需網絡)、Mistral、Anthropic 和 OpenAI,可針對不同角色選擇不同模型。它內置了秘密清洗和注入防護機制,確保安全。該項目完全開源,採用 Apache 2.0 許可證,可在開源或閉源項目中自由使用、自託管和修改。

Nightwatch 的核心理念是只讀安全性:它永遠不會執行任何命令,不會更改閾值,也不會寫回生產環境。每一個修復建議都是可複製的人工製品,由人類批准後執行。這種設計確保了即使在最敏感的環境中也能安全部署。