AI News HubLIVE
站内改写1 分鐘閱讀

AI編程:循環工程一個翻譯器

作者嘗試使用本地模型構建一個翻譯管道,通過規劃、執行、批評和修復循環來處理大型韓語到英語的翻譯,但最終未能顯著提高質量,並等待更好的模型的到來。

來源Hacker News AI作者: jeena

大約兩週前,繼“提示工程”和“代理工作流”似乎已不夠用之後,“循環工程”這一術語開始浮出水面。作者在2024年12月首次嘗試利用大型語言模型(LLM)執行實用任務,即在搭載12GB顯存的本地RTX 3060上將大型韓語文檔翻譯為英語。當時ChatGPT的上下文窗口對於所需處理的大型文檔而言過於狹小,且翻譯會在10%處停止,因此作者認為可以自動對文檔進行拆分。

由於對代理架構缺乏瞭解,作者自行設計了一個複雜的代理管道:將原始韓語轉錄文本通過“規劃→執行→批評→修復”循環轉化為英語翻譯。管道組件包括:KSS語句分割、TextChunker分塊、qwen3:14b規劃器、aya:8b執行器、qwen3:14b批評器、NLLB-200參考模型、Python字典翻譯記憶、可選的格式化器以及輸出寫入器。規劃器讀取摘錄後生成全局策略作為JSON,執行器基於策略翻譯每個塊,批評器通過三路比較(源文本、執行器輸出和NLLB參考)驗證翻譯,返回狀態、問題、修復指令和提取的術語/風格。翻譯記憶累積術語和風格,確保跨塊一致性。NLLB提供逐字翻譯作為公正參考,僅批評器可見,防止執行器自信地產生幻覺。

作者因實際需求——翻譯數小時的教育類YouTube視頻轉錄文本——投入了數週時間。起初僅為簡單循環,但本地模型質量不佳,於是引入批評器並將反饋信息注入提示,隨後發現術語翻譯逐漸漂移,又加入記憶機制。此外還進行了許多微小優化,如分塊重疊窗口等。然而最終,批評器和記憶信息並未帶來更好的翻譯效果。批評器持續標記翻譯不夠完善,導致循環回溯,而執行器無法達到批評器的滿意標準。作者未能通過微調使翻譯質量有顯著提升,數週後決定放棄,等待更好的本地翻譯模型出現。屆時,這種循環工程可能也不再必要。