2026-07-03 12:00 UTC+8站内改写1 分钟阅读更新: 2026-07-03 16:14 UTC+8

RuleChef：将大语言模型任务知识转化为可编辑规则

RuleChef是一个利用大语言模型（LLM）为自然语言处理任务（如文本分类、命名实体识别、关系抽取）生成可执行规则的框架。它基于任务描述和标注示例生成规则，并通过额外示例和人类反馈迭代改进。LLM仅在训练阶段使用，最终产生快速、确定且可检查的规则系统。初步评估在分类和NER任务上进行，并开源发布。

来源arXiv Computational Linguistics作者: \'Ad\'am Kov\'acs, Nadia Verdha, G\'abor Recski

近年来，大语言模型（LLM）在自然语言处理领域取得了显著成就，但其黑箱特性限制了在需要可解释性和确定性的场景中的应用。RuleChef框架应运而生，旨在将LLM理解的任务知识转化为人类可读、可编辑的规则系统。该框架由Ádám Kovács等人提出，并已开源发布。

具体来说，RuleChef的工作流程分为几个阶段。首先，用户提供任务描述和少量标注示例，LLM基于这些信息生成一组初始规则。这些规则采用类似于编程语言中if-then语句的形式，可以直观地理解每个规则的条件和动作。然而，初始规则往往不够完善，因此RuleChef引入了迭代优化机制。系统会在一个留出集上评估规则的性能，标记出失败的案例，并调用LLM自动生成补丁来修复这些失败。此外，人类专家也可以直接审查和修改规则，提供更精准的反馈。

RuleChef的一大亮点是其模型知识迁移能力。它能够观察任意现有模型（包括其他LLM或传统机器学习模型）的输入输出对，从中提取模式并转化为规则。这意味着即使原始模型是黑箱，其行为也可以通过RuleChef被“蒸馏”成透明的规则系统。这对于依赖专有模型或需要合规审计的组织尤为重要。

在初步评估中，RuleChef在文本分类和命名实体识别（NER）任务上展现了有竞争力的性能。虽然没有达到最先进LLM的水平，但其推理速度更快、结果完全可复现，并且允许人类干预。论文指出，RuleChef特别适用于那些对延迟敏感、需要高频推理，或者必须满足监管要求的应用场景。

RuleChef以Apache 2.0许可证开源，代码和文档已在GitHub上发布。研究团队计划进一步扩展其能力，例如支持更多任务类型（如关系抽取）、优化规则生成策略，以及增强与人类协作的界面。这一工作为连接神经符号推理和实际NLP部署提供了有价值的桥梁。