2026-06-19站内改写1 分鐘閱讀更新: 2026-06-19

AI編程：循環工程一個翻譯器

作者嘗試使用本地模型構建一個翻譯管道，通過規劃、執行、批評和修復循環來處理大型韓語到英語的翻譯，但最終未能顯著提高質量，並等待更好的模型的到來。

大約兩週前，繼“提示工程”和“代理工作流”似乎已不夠用之後，“循環工程”這一術語開始浮出水面。作者在2024年12月首次嘗試利用大型語言模型（LLM）執行實用任務，即在搭載12GB顯存的本地RTX 3060上將大型韓語文檔翻譯為英語。當時ChatGPT的上下文窗口對於所需處理的大型文檔而言過於狹小，且翻譯會在10%處停止，因此作者認為可以自動對文檔進行拆分。

由於對代理架構缺乏瞭解，作者自行設計了一個複雜的代理管道：將原始韓語轉錄文本通過“規劃→執行→批評→修復”循環轉化為英語翻譯。管道組件包括：KSS語句分割、TextChunker分塊、qwen3:14b規劃器、aya:8b執行器、qwen3:14b批評器、NLLB-200參考模型、Python字典翻譯記憶、可選的格式化器以及輸出寫入器。規劃器讀取摘錄後生成全局策略作為JSON，執行器基於策略翻譯每個塊，批評器通過三路比較（源文本、執行器輸出和NLLB參考）驗證翻譯，返回狀態、問題、修復指令和提取的術語/風格。翻譯記憶累積術語和風格，確保跨塊一致性。NLLB提供逐字翻譯作為公正參考，僅批評器可見，防止執行器自信地產生幻覺。

作者因實際需求——翻譯數小時的教育類YouTube視頻轉錄文本——投入了數週時間。起初僅為簡單循環，但本地模型質量不佳，於是引入批評器並將反饋信息注入提示，隨後發現術語翻譯逐漸漂移，又加入記憶機制。此外還進行了許多微小優化，如分塊重疊窗口等。然而最終，批評器和記憶信息並未帶來更好的翻譯效果。批評器持續標記翻譯不夠完善，導致循環回溯，而執行器無法達到批評器的滿意標準。作者未能通過微調使翻譯質量有顯著提升，數週後決定放棄，等待更好的本地翻譯模型出現。屆時，這種循環工程可能也不再必要。