AI News HubLIVE
站內改寫1 分鐘閱讀

Show HN:Mirrors – 透過重放真實生產軌跡測試AI代理變更

Mirrors 將生產軌跡轉化為代理環境的隔離副本,讓您在不影響使用者的情況下測試變更。它透過確定性回放和工具呼叫評分,幫助捕獲迴歸、復現錯誤並安全地測試風險流程。

來源Hacker News AI作者: aisinghal

Mirrors 是一款面向 AI 代理的測試工具,能將生產軌跡轉化為一個完全隔離的環境映象。透過連線代理的生產跟蹤資料,它自動重建實體、資料庫模式以及所有繫結的工具,並生成一個確定性的映象世界——相同的種子和指令會產生位元組級一致的結果。

使用方式極其簡單:開發者只需透過瀏覽器登入,無需任何 API 金鑰。在終端執行一條命令(claude mcp add --transport http mirrors https://api.runmirrors.com/mcp),然後使用 /mcp → mirrors → Authenticate via browser 即可完成認證。隨後即可在一分鐘內獲得一個可執行的映象環境。

映象的核心能力在於其確定性。每個工具呼叫都會在隔離的資料庫或 LLM 模擬器上重放,完全避免觸及生產系統。例如,在航空公司客服場景中,get_reservation_details 等工具呼叫在映象中百分百成功,但 issue_refund 等敏感操作則透過 LLM 模擬器安全執行。開發人員可以隨意執行退款、刪除或傳送操作,而無需擔心破壞真實資料。

Mirrors 的工作流程分為三步:第一步,從 ADK 或可觀測性平臺引入生產軌跡,系統自動發現實體、重建模式並識別所有工具;第二步,構建一個隔離的映象,包含種子資料庫和繫結的工具,每個工具都根據其與真實軌跡的匹配程度進行打分;第三步,反覆重放代理,度量準確率,捕獲迴歸問題,並確保變更可以安全上線。

該工具解決了 AI 代理開發中的關鍵痛點:任何錯誤都可以透過相同的種子和指令精確復現;危險的流程可以在隔離環境中測試;迴歸問題可以在程式碼部署前被發現。每次構建都可以關聯到特定的記錄世界,並判定透過或失敗。而且,每個執行例項都可以按需啟動,用完即停,按分鐘計費。

對於團隊協作,Mirrors 提供了版本化的 /v1 API 和工作空間金鑰,允許從自有應用中驅動映象。免費套餐包含每月 60 沙盒分鐘、無限的映象構建和確定性種子。當團隊需要無限沙盒、API 和 SSO 時,可以選擇定製方案。