知识图谱增强的零样本主题分类:多策略比较研究
本研究提出一个基于知识图谱的零样本多标签主题分类框架,系统比较了八种方法(四种基础变体及其图增强版本)在十五个大语言模型和八个数据集上的表现。结果表明,关键词增强分类(AK)是最佳基础方法;图增强对小型模型有正面影响,但对大型模型效果不佳,说明大型模型已从预训练中获得足够的关系信息。自一致性解码未提升性能,但计算成本增加约五倍。
近日,一项由Shahana Akter等人完成的研究在arXiv上发布,题为《知识图谱增强的零样本主题分类:多策略比较研究》。该研究针对零样本多标签主题分类这一挑战性任务,提出了一种融合每篇文档知识图谱的框架,并系统评估了多种策略的有效性。
零样本主题分类旨在无需任何标注训练数据的情况下,对文档进行多标签分类。当文档包含复杂的实体间关系时,这一任务尤为困难。研究团队设计了一个基础框架,包含四种变体:仅基于文章内容分类(article-only)、关键词增强分类(keyword-enhanced, 简称AK),以及这两种方法的自一致性解码变体。在此基础上,他们进一步为每种变体添加了基于文章内容自动构建的知识图谱,该图谱通过类似KGGen的流水线从输入文档中提取主体-谓语-客体三元组,从而形成结构化的关系表示。
为了全面评估,研究人员在15个不同规模的大语言模型(LLM)和8个跨领域多标签数据集上进行了实验,对比了4种基础方法和4种图增强方法,共计8种配置。实验涵盖的模型从较小参数量的模型到大型前沿模型,数据集则覆盖新闻、科学、商业等多个领域。
结果揭示了一系列重要发现。在基础方法中,关键词增强分类(AK)表现最为出色,并且在15个LLM中,有6个在零样本设置下超越了传统的句子编码器基线。这一结果表明,即使不经过微调,直接利用LLM的内部分类能力辅以关键词提示也能取得良好效果。然而,知识图谱增强的效果呈现显著的模型规模依赖性:对于参数量较小的LLM,图增强能带来性能提升;但对于大型LLM,图增强反而导致性能下降,这暗示大型模型在预训练过程中已经捕获了足够的实体关系信息,额外的知识图谱信息可能引入噪声或冗余。此外,自一致性解码变体——即对同一输入进行多次采样并取多数结果——在所有实验中都未能提升性能,反而将计算成本提高了约五倍。
这项研究为零样本分类中知识图谱的应用提供了宝贵的实证分析。它强调了模型规模在决定外部知识作用时的关键角色,并指出对于已经具备强大关系推理能力的大型模型,简单的提示策略可能比复杂的图增强更为有效。同时,自一致性解码的无效性也提醒研究者,在追求模型鲁棒性时需要谨慎权衡计算开销。未来工作可进一步探索如何动态决定是否引入知识图谱,以及如何设计更高效的解码策略。