AI News HubLIVE
站內改寫2 分鐘閱讀

可觀測性的未來不會是單一專利AI代理,而是由團隊構建的數千個代理

文章認為,可觀測性不會演變為一個通用的AI代理,而是由數千個專門為團隊構建的代理組成,強調了上下文、開放性和共享調查工件的重要性。

來源Hacker News AI作者: mikeshi42

當前,許多可觀測性供應商押注於一個統一的SRE代理,希望將其集成到一個平台中,使其能夠理解遙測數據、回答問題並修復生產問題。然而,這種願景過於狹窄。現實中的調試工作因團隊而異:數據庫團隊、前端團隊、支付團隊和基礎設施團隊處理問題的方式截然不同。因此,可觀測性的未來不是單一的專屬代理,而是由各個團隊構建的數千個專門代理。

隨着AI模型不斷進步,代理正成為可觀測性的新界面。人類→代理→數據的模式將取代傳統的人類→儀表盤→數據。工程師不再直接查看圖表或編寫查詢,而是由代理自動進行查詢、總結和假設生成。DoorDash的Anil K指出,工程師在Slack頻道中分享的不再是日誌鏈接,而是AI調查的片段。

代理的引入改變了可觀測性工作負載的性質。人類調查者通常只能比較兩三個時間窗口,而代理可以同時比較二十個,並同時探索數十個假設。這導致對底層系統的查詢量大幅增加,要求API層和存儲系統能夠應對這種非線性模式。此外,代理的推理能力依賴於數據的完整性和保真度。如果歷史數據被丟棄或嚴重採樣,代理將無法像經驗豐富的工程師那樣憑直覺彌補。

目前,許多公司投資於“通用SRE代理”的設想。雖然這能降低可觀測性的使用門檻,但調試的難點在於上下文。調查的下一步不僅取決於平台內的遙測數據,還取決於團隊的運營方式、信任的信號、之前的故障記錄、內部文檔、Slack線程等。這些上下文分散在多個地方,且每個組織、每個團隊都不同。例如,RingCentral的AI負責人Sushant Hiray提到,公司有大量隱性知識未記錄,代理缺乏數據時會生成幻覺。

因此,可觀測性更可能演變為一個生態系統,包含針對基礎設施、數據庫、安全、支付等不同領域的專門代理,每個代理都基於組織的運行手冊、文檔和業務邏輯。這種未來依賴於開放性——不僅僅是開源,而是讓團隊自由選擇每個層次的工具,包括模型、工具鏈、工作流和接口。代理應該適配現有系統,而非強迫系統適應供應商。

即使在團隊構建自己的代理後,合作問題依然存在。調查結果不應停留在私有的聊天會話中,而需要持久的、可審查的工件,記錄查詢、證據和結論。這些工件不僅供人類使用,也能讓未來的代理從之前的調查中學習。因此,需要一種持久的調查表面,讓人類和代理協作共享、審查和改進調查。

最終,人類仍將處於控制平面。代理可以高效收集證據、探索假設,但缺乏判斷業務優先級、權衡風險和做出決策的能力。儘管未來可能出現代理間的協作,但當前人類的判斷仍是關鍵。