2026-06-01 12:00 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

知识图谱增强的零样本主题分类：多策略比较研究

本研究提出一个基于知识图谱的零样本多标签主题分类框架，系统比较了八种方法（四种基础变体及其图增强版本）在十五个大语言模型和八个数据集上的表现。结果表明，关键词增强分类（AK）是最佳基础方法；图增强对小型模型有正面影响，但对大型模型效果不佳，说明大型模型已从预训练中获得足够的关系信息。自一致性解码未提升性能，但计算成本增加约五倍。

来源arXiv Computational Linguistics作者: Shahana Akter, Yatharth Vohra, Ankita Shukla, Souvika Sarkar

近日，一项由Shahana Akter等人完成的研究在arXiv上发布，题为《知识图谱增强的零样本主题分类：多策略比较研究》。该研究针对零样本多标签主题分类这一挑战性任务，提出了一种融合每篇文档知识图谱的框架，并系统评估了多种策略的有效性。

零样本主题分类旨在无需任何标注训练数据的情况下，对文档进行多标签分类。当文档包含复杂的实体间关系时，这一任务尤为困难。研究团队设计了一个基础框架，包含四种变体：仅基于文章内容分类（article-only）、关键词增强分类（keyword-enhanced, 简称AK），以及这两种方法的自一致性解码变体。在此基础上，他们进一步为每种变体添加了基于文章内容自动构建的知识图谱，该图谱通过类似KGGen的流水线从输入文档中提取主体-谓语-客体三元组，从而形成结构化的关系表示。

为了全面评估，研究人员在15个不同规模的大语言模型（LLM）和8个跨领域多标签数据集上进行了实验，对比了4种基础方法和4种图增强方法，共计8种配置。实验涵盖的模型从较小参数量的模型到大型前沿模型，数据集则覆盖新闻、科学、商业等多个领域。

结果揭示了一系列重要发现。在基础方法中，关键词增强分类（AK）表现最为出色，并且在15个LLM中，有6个在零样本设置下超越了传统的句子编码器基线。这一结果表明，即使不经过微调，直接利用LLM的内部分类能力辅以关键词提示也能取得良好效果。然而，知识图谱增强的效果呈现显著的模型规模依赖性：对于参数量较小的LLM，图增强能带来性能提升；但对于大型LLM，图增强反而导致性能下降，这暗示大型模型在预训练过程中已经捕获了足够的实体关系信息，额外的知识图谱信息可能引入噪声或冗余。此外，自一致性解码变体——即对同一输入进行多次采样并取多数结果——在所有实验中都未能提升性能，反而将计算成本提高了约五倍。

这项研究为零样本分类中知识图谱的应用提供了宝贵的实证分析。它强调了模型规模在决定外部知识作用时的关键角色，并指出对于已经具备强大关系推理能力的大型模型，简单的提示策略可能比复杂的图增强更为有效。同时，自一致性解码的无效性也提醒研究者，在追求模型鲁棒性时需要谨慎权衡计算开销。未来工作可进一步探索如何动态决定是否引入知识图谱，以及如何设计更高效的解码策略。