2026-06-17站内改写2 分鐘閱讀更新: 2026-06-17

MLLP-VRAIN UPV 系統在 IWSLT 2026 同聲傳譯任務中的表現

本文介紹了 MLLP-VRAIN 研究組參與 IWSLT 2026 同聲傳譯共享任務的系統。該系統利用最新發布的 Parakeet 和 Qwen 3.5 模型，通過自適應“黑盒”策略構建魯棒的級聯解決方案，並探索策略鬆弛以優化質量-延遲權衡。系統參與所有語言方向，並針對 En→De、It、Zh 方向引入新的上下文軌道，結合 ASR 詞彙增強和離線預翻譯示例的 RAG 機制。在 MCIF En→De 測試集上，質量提升 +5.82 XCOMET-XL，上下文處理額外提升 +1.03。

來源arXiv Computational Linguistics作者: Jorge Iranzo-S\'anchez, Gerard Mas-Moll\`a, Adri\`a Gim\'enez, Jorge Civera, Albert Sanchis, Alfons Juan

MLLP-VRAIN UPV 研究團隊近日發佈了一篇系統描述論文，詳細介紹了其參與 IWSLT 2026 同聲傳譯（SimulST）共享任務的方案。該論文於2026年6月15日提交至 arXiv，作者包括 Jorge Iranzo-Sánchez、Gerard Mas-Mollà、Adrià Giménez、Jorge Civera、Albert Sanchis 和 Alfons Juan。團隊利用近期發佈的 Parakeet 和 Qwen 3.5 模型，構建了一個級聯式的同聲翻譯系統。該系統首先通過 Parakeet 進行語音識別，然後將識別結果送入 Qwen 3.5 模型進行翻譯。為了處理長語音輸入，團隊採用了自適應“黑盒”策略，並探索了策略鬆弛方法，以在翻譯質量和延遲之間取得更好的平衡。與去年相比，今年團隊參與了所有語言方向的翻譯任務，覆蓋範圍更廣，包括英語到德語、意大利語、漢語等。

針對英語到德語、意大利語和漢語的翻譯方向，團隊還參加了今年新增的上下文跟蹤賽道。該賽道結合了兩種關鍵技術：ASR 詞彙增強（word-boosting）和基於檢索增強生成（RAG）的離線預翻譯範例引導。ASR 詞彙增強能夠提高特定領域術語的識別準確率，而 RAG 機制則利用預先翻譯的示例為模型提供上下文信息，從而提升生成結果的連貫性和專業性。這種雙管齊下的方法使得系統能夠更有效地處理特定領域的翻譯需求。例如，在醫療或法律領域，專業術語和固定搭配的翻譯準確率得到了顯著提升。

在性能評估方面，團隊在 MCIF 英語到德語測試集上進行了詳細測試。結果顯示，與去年的系統相比，今年的系統在 XCOMET-XL 評分上實現了 5.82 分的顯著提升。進一步地，上下文跟蹤處理額外帶來了 1.03 分的提升。此外，論文還提供了系統的延遲分析，展示了其在實時翻譯場景中的實際表現。分析表明，通過自適應策略鬆弛，系統能夠在保持較高翻譯質量的同時，將延遲控制在可接受範圍內。

這一研究成果不僅證明了 Parakeet 和 Qwen 3.5 模型在同聲翻譯中的有效性，也展示了自適應策略和上下文增強技術在提升翻譯質量和降低延遲方面的潛力。對於未來實時語音翻譯系統的開發具有重要的參考價值。團隊計劃在後續工作中進一步優化策略，並探索更多語言對和領域的應用。