AI News HubLIVE
站内改写1 分钟阅读

AI编程:循环工程一个翻译器

作者尝试使用本地模型构建一个翻译管道,通过规划、执行、批评和修复循环来处理大型韩语到英语的翻译,但最终未能显著提高质量,并等待更好的模型的到来。

来源Hacker News AI作者: jeena

大约两周前,继“提示工程”和“代理工作流”似乎已不够用之后,“循环工程”这一术语开始浮出水面。作者在2024年12月首次尝试利用大型语言模型(LLM)执行实用任务,即在搭载12GB显存的本地RTX 3060上将大型韩语文档翻译为英语。当时ChatGPT的上下文窗口对于所需处理的大型文档而言过于狭小,且翻译会在10%处停止,因此作者认为可以自动对文档进行拆分。

由于对代理架构缺乏了解,作者自行设计了一个复杂的代理管道:将原始韩语转录文本通过“规划→执行→批评→修复”循环转化为英语翻译。管道组件包括:KSS语句分割、TextChunker分块、qwen3:14b规划器、aya:8b执行器、qwen3:14b批评器、NLLB-200参考模型、Python字典翻译记忆、可选的格式化器以及输出写入器。规划器读取摘录后生成全局策略作为JSON,执行器基于策略翻译每个块,批评器通过三路比较(源文本、执行器输出和NLLB参考)验证翻译,返回状态、问题、修复指令和提取的术语/风格。翻译记忆累积术语和风格,确保跨块一致性。NLLB提供逐字翻译作为公正参考,仅批评器可见,防止执行器自信地产生幻觉。

作者因实际需求——翻译数小时的教育类YouTube视频转录文本——投入了数周时间。起初仅为简单循环,但本地模型质量不佳,于是引入批评器并将反馈信息注入提示,随后发现术语翻译逐渐漂移,又加入记忆机制。此外还进行了许多微小优化,如分块重叠窗口等。然而最终,批评器和记忆信息并未带来更好的翻译效果。批评器持续标记翻译不够完善,导致循环回溯,而执行器无法达到批评器的满意标准。作者未能通过微调使翻译质量有显著提升,数周后决定放弃,等待更好的本地翻译模型出现。届时,这种循环工程可能也不再必要。