2026-07-03 06:29 UTC+8站內改寫1 分鐘閱讀更新: 2026-07-03 06:34 UTC+8

Show HN：Mirrors – 透過重放真實生產軌跡測試AI代理變更

Mirrors 將生產軌跡轉化為代理環境的隔離副本，讓您在不影響使用者的情況下測試變更。它透過確定性回放和工具呼叫評分，幫助捕獲迴歸、復現錯誤並安全地測試風險流程。

來源Hacker News AI作者: aisinghal

Mirrors 是一款面向 AI 代理的測試工具，能將生產軌跡轉化為一個完全隔離的環境映象。透過連線代理的生產跟蹤資料，它自動重建實體、資料庫模式以及所有繫結的工具，並生成一個確定性的映象世界——相同的種子和指令會產生位元組級一致的結果。

使用方式極其簡單：開發者只需透過瀏覽器登入，無需任何 API 金鑰。在終端執行一條命令（claude mcp add --transport http mirrors https://api.runmirrors.com/mcp），然後使用 /mcp → mirrors → Authenticate via browser 即可完成認證。隨後即可在一分鐘內獲得一個可執行的映象環境。

映象的核心能力在於其確定性。每個工具呼叫都會在隔離的資料庫或 LLM 模擬器上重放，完全避免觸及生產系統。例如，在航空公司客服場景中，get_reservation_details 等工具呼叫在映象中百分百成功，但 issue_refund 等敏感操作則透過 LLM 模擬器安全執行。開發人員可以隨意執行退款、刪除或傳送操作，而無需擔心破壞真實資料。

Mirrors 的工作流程分為三步：第一步，從 ADK 或可觀測性平臺引入生產軌跡，系統自動發現實體、重建模式並識別所有工具；第二步，構建一個隔離的映象，包含種子資料庫和繫結的工具，每個工具都根據其與真實軌跡的匹配程度進行打分；第三步，反覆重放代理，度量準確率，捕獲迴歸問題，並確保變更可以安全上線。

該工具解決了 AI 代理開發中的關鍵痛點：任何錯誤都可以透過相同的種子和指令精確復現；危險的流程可以在隔離環境中測試；迴歸問題可以在程式碼部署前被發現。每次構建都可以關聯到特定的記錄世界，並判定透過或失敗。而且，每個執行例項都可以按需啟動，用完即停，按分鐘計費。

對於團隊協作，Mirrors 提供了版本化的 /v1 API 和工作空間金鑰，允許從自有應用中驅動映象。免費套餐包含每月 60 沙盒分鐘、無限的映象構建和確定性種子。當團隊需要無限沙盒、API 和 SSO 時，可以選擇定製方案。