AI News HubLIVE
站内改写1 分鐘閱讀

上下文壓縮並非單一事物:匹配預算下可讀符號重新表達與連貫摘要的比較

研究人員提出了一種名為'Telegraph English'的可讀符號格式,用於多跳問答中的上下文壓縮。它以更少的令牌成本將檢索到的段落重寫為結構化的實體-關係語句,從而保留推理證據。在MuSiQue、TwoWiki和HotpotQA上的對照實驗中,它在每個資料集上都優於三種匹配預算的壓縮基線(字元級刪除、截斷和隨機子取樣),F1分數提高了13到20個百分點。在最難的資料集上,它還優於同一編碼器生成的連貫散文摘要。預先註冊的深度互動假設未得到支援:優勢並未隨資料集內推理深度的增加而增加。這些結果表明,在匹配的令牌預算下,可讀符號重新表達比自然語言或連貫摘要更能密集地保留實體內容。

來源arXiv Computational Linguistics作者: Sisong Bei, Mikhail L. Arbuzov, Ziwei Dong, Dmitri Kalaev, Alexey Shvets

上下文壓縮是自然語言處理中的一個重要問題,特別是在多跳問答任務中,模型需要從多個篇章中推理出答案。然而,現有壓縮方法往往在保留推理證據和降低令牌成本之間存在權衡。最近,一篇來自arXiv的論文(arXiv:2606.14875)提出了一種名為“Telegraph English”的可讀符號格式,旨在解決這一挑戰。

Telegraph English的核心思想是將檢索到的段落重寫為結構化的實體-關係語句。這種格式保留了實體間的邏輯關係,同時以更少的令牌壓縮了原始文本。與傳統的字元級刪除、截斷或隨機子取樣等基線方法相比,Telegraph English能夠更密集地保留實體內容。研究人員在三個多跳問答資料集(MuSiQue、TwoWiki和HotpotQA)上進行了對照實驗,結果顯示,在所有資料集上,Telegraph English均優於三種匹配預算的壓縮基線,F1分數提升了13到20個百分點。在最難的資料集上,它甚至優於同一編碼器生成的連貫散文摘要。

值得注意的是,研究人員預設的一個假設——壓縮優勢會隨著推理深度的增加而增大——並未得到實驗資料支援。這表明,Telegraph English的有效性並非依賴於推理鏈的長度,而是源於其獨特的符號化表達方式。這項研究提供了新的證據,表明在匹配的令牌預算下,可讀的符號重新表達比自然語言或連貫摘要更能保留實體內容,從而為小語言模型在複雜推理任務中的應用提供了新的思路。

此外,該研究還強調了上下文壓縮不僅是一種技術,更是一種策略選擇。Telegraph English格式的可讀性和符號化特性使其在保留關鍵資訊的同時,能夠顯著降低計算成本。這對於資源受限的環境尤為重要,例如移動裝置或即時推理系統。未來,研究人員計劃進一步探索Telegraph English在不同語言和領域中的適用性,並最佳化其生成效率。