AI News HubLIVE
站内改写1 分鐘閱讀

Show HN: Nightwatch——開源、只讀的AI SRE工具

Nightwatch(ninoxAI)是一款開源、只讀的AI SRE工具,它從監控工具中攝取告警,將其聚類為事件,利用AI代理調查根本原因,並提出供人類批准的修復建議。它是本地優先且與監控工具無關的。

來源Hacker News AI作者: egorferber

Nightwatch(亦稱 ninoxAI)是一款開源的、只讀的 AI SRE(站點可靠性工程)工具。它的設計理念是觀察、推理並建議,但絕不執行任何操作。當監控系統發出告警風暴時,Nightwatch 能夠將這些告警聚類為單一事件,並自動調查根本原因。它支援多種監控工具,如 Checkmk、Prometheus、Icinga2、Zabbix 等,並透過只讀介面卡收集告警資訊。

快速啟動:只需複製環境變數檔案並執行 Docker Compose,即可在 60 秒內體驗。對於沒有即時監控的環境,它還可以生成模擬告警進行演示。在後臺,Nightwatch 使用工具呼叫型大語言模型(LLM)驅動只讀調查代理,該代理可以訪問 Docker、Kubernetes、AWS、Grafana、GitHub 和 Git 等系統,收集即時證據,形成假設,並提出分類修復建議。所有建議都帶有風險等級和影響範圍,需要人工批准後才能執行。

Nightwatch 的架構包括攝取、標準化、聚類、噪聲評分、推薦和調查等階段。它還支援分散式部署,透過名為“ninox”的輕量級 runner 在隔離環境中執行,只向外發起連線,無需開放入站防火牆埠。每個 runner 持有本地憑據,並向中央大腦報告只讀能力。

此外,Nightwatch 支援多種 LLM 提供商,包括本地模板(無需網路)、Mistral、Anthropic 和 OpenAI,可針對不同角色選擇不同模型。它內建了秘密清洗和注入防護機制,確保安全。該專案完全開源,採用 Apache 2.0 許可證,可在開源或閉源專案中自由使用、自託管和修改。

Nightwatch 的核心理念是只讀安全性:它永遠不會執行任何命令,不會更改閾值,也不會寫回生產環境。每一個修復建議都是可複製的人工製品,由人類批准後執行。這種設計確保了即使在最敏感的環境中也能安全部署。