2026-06-08 04:24 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Show HN: Nightwatch——開源、只讀的AI SRE工具

Nightwatch（ninoxAI）是一款開源、只讀的AI SRE工具，它從監控工具中攝取告警，將其聚類為事件，利用AI代理調查根本原因，並提出供人類批准的修復建議。它是本地優先且與監控工具無關的。

來源Hacker News AI作者: egorferber

Nightwatch（亦稱 ninoxAI）是一款開源的、只讀的 AI SRE（站點可靠性工程）工具。它的設計理念是觀察、推理並建議，但絕不執行任何操作。當監控系統發出告警風暴時，Nightwatch 能夠將這些告警聚類為單一事件，並自動調查根本原因。它支援多種監控工具，如 Checkmk、Prometheus、Icinga2、Zabbix 等，並透過只讀介面卡收集告警資訊。

快速啟動：只需複製環境變數檔案並執行 Docker Compose，即可在 60 秒內體驗。對於沒有即時監控的環境，它還可以生成模擬告警進行演示。在後臺，Nightwatch 使用工具呼叫型大語言模型（LLM）驅動只讀調查代理，該代理可以訪問 Docker、Kubernetes、AWS、Grafana、GitHub 和 Git 等系統，收集即時證據，形成假設，並提出分類修復建議。所有建議都帶有風險等級和影響範圍，需要人工批准後才能執行。

Nightwatch 的架構包括攝取、標準化、聚類、噪聲評分、推薦和調查等階段。它還支援分散式部署，透過名為“ninox”的輕量級 runner 在隔離環境中執行，只向外發起連線，無需開放入站防火牆埠。每個 runner 持有本地憑據，並向中央大腦報告只讀能力。

此外，Nightwatch 支援多種 LLM 提供商，包括本地模板（無需網路）、Mistral、Anthropic 和 OpenAI，可針對不同角色選擇不同模型。它內建了秘密清洗和注入防護機制，確保安全。該專案完全開源，採用 Apache 2.0 許可證，可在開源或閉源專案中自由使用、自託管和修改。

Nightwatch 的核心理念是只讀安全性：它永遠不會執行任何命令，不會更改閾值，也不會寫回生產環境。每一個修復建議都是可複製的人工製品，由人類批准後執行。這種設計確保了即使在最敏感的環境中也能安全部署。