MLLP-VRAIN UPV 系统在 IWSLT 2026 同声传译任务中的表现
本文介绍了 MLLP-VRAIN 研究组参与 IWSLT 2026 同声传译共享任务的系统。该系统利用最新发布的 Parakeet 和 Qwen 3.5 模型,通过自适应“黑盒”策略构建鲁棒的级联解决方案,并探索策略松弛以优化质量-延迟权衡。系统参与所有语言方向,并针对 En→De、It、Zh 方向引入新的上下文轨道,结合 ASR 词汇增强和离线预翻译示例的 RAG 机制。在 MCIF En→De 测试集上,质量提升 +5.82 XCOMET-XL,上下文处理额外提升 +1.03。
MLLP-VRAIN UPV 研究团队近日发布了一篇系统描述论文,详细介绍了其参与 IWSLT 2026 同声传译(SimulST)共享任务的方案。该论文于2026年6月15日提交至 arXiv,作者包括 Jorge Iranzo-Sánchez、Gerard Mas-Mollà、Adrià Giménez、Jorge Civera、Albert Sanchis 和 Alfons Juan。团队利用近期发布的 Parakeet 和 Qwen 3.5 模型,构建了一个级联式的同声翻译系统。该系统首先通过 Parakeet 进行语音识别,然后将识别结果送入 Qwen 3.5 模型进行翻译。为了处理长语音输入,团队采用了自适应“黑盒”策略,并探索了策略松弛方法,以在翻译质量和延迟之间取得更好的平衡。与去年相比,今年团队参与了所有语言方向的翻译任务,覆盖范围更广,包括英语到德语、意大利语、汉语等。
针对英语到德语、意大利语和汉语的翻译方向,团队还参加了今年新增的上下文跟踪赛道。该赛道结合了两种关键技术:ASR 词汇增强(word-boosting)和基于检索增强生成(RAG)的离线预翻译范例引导。ASR 词汇增强能够提高特定领域术语的识别准确率,而 RAG 机制则利用预先翻译的示例为模型提供上下文信息,从而提升生成结果的连贯性和专业性。这种双管齐下的方法使得系统能够更有效地处理特定领域的翻译需求。例如,在医疗或法律领域,专业术语和固定搭配的翻译准确率得到了显著提升。
在性能评估方面,团队在 MCIF 英语到德语测试集上进行了详细测试。结果显示,与去年的系统相比,今年的系统在 XCOMET-XL 评分上实现了 5.82 分的显著提升。进一步地,上下文跟踪处理额外带来了 1.03 分的提升。此外,论文还提供了系统的延迟分析,展示了其在实时翻译场景中的实际表现。分析表明,通过自适应策略松弛,系统能够在保持较高翻译质量的同时,将延迟控制在可接受范围内。
这一研究成果不仅证明了 Parakeet 和 Qwen 3.5 模型在同声翻译中的有效性,也展示了自适应策略和上下文增强技术在提升翻译质量和降低延迟方面的潜力。对于未来实时语音翻译系统的开发具有重要的参考价值。团队计划在后续工作中进一步优化策略,并探索更多语言对和领域的应用。