2026-07-03 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-07-03 16:14 UTC+8

RuleChef：將大語言模型任務知識轉化為可編輯規則

RuleChef是一個利用大語言模型（LLM）為自然語言處理任務（如文本分類、命名實體識別、關係抽取）生成可執行規則的框架。它基於任務描述和標註示例生成規則，並透過額外示例和人類反饋迭代改進。LLM僅在訓練階段使用，最終產生快速、確定且可檢查的規則系統。初步評估在分類和NER任務上進行，並開源釋出。

來源arXiv Computational Linguistics作者: \'Ad\'am Kov\'acs, Nadia Verdha, G\'abor Recski

近年來，大語言模型（LLM）在自然語言處理領域取得了顯著成就，但其黑箱特性限制了在需要可解釋性和確定性的場景中的應用。RuleChef框架應運而生，旨在將LLM理解的任務知識轉化為人類可讀、可編輯的規則系統。該框架由Ádám Kovács等人提出，並已開源釋出。

具體來說，RuleChef的工作流程分為幾個階段。首先，使用者提供任務描述和少量標註示例，LLM基於這些資訊生成一組初始規則。這些規則採用類似於程式語言中if-then語句的形式，可以直觀地理解每個規則的條件和動作。然而，初始規則往往不夠完善，因此RuleChef引入了迭代最佳化機制。系統會在一個留出集上評估規則的效能，標記出失敗的案例，並呼叫LLM自動生成補丁來修復這些失敗。此外，人類專家也可以直接審查和修改規則，提供更精準的反饋。

RuleChef的一大亮點是其模型知識遷移能力。它能夠觀察任意現有模型（包括其他LLM或傳統機器學習模型）的輸入輸出對，從中提取模式並轉化為規則。這意味著即使原始模型是黑箱，其行為也可以透過RuleChef被“蒸餾”成透明的規則系統。這對於依賴專有模型或需要合規審計的組織尤為重要。

在初步評估中，RuleChef在文本分類和命名實體識別（NER）任務上展現了有競爭力的效能。雖然沒有達到最先進LLM的水平，但其推理速度更快、結果完全可復現，並且允許人類干預。論文指出，RuleChef特別適用於那些對延遲敏感、需要高頻推理，或者必須滿足監管要求的應用場景。

RuleChef以Apache 2.0許可證開源，程式碼和文件已在GitHub上釋出。研究團隊計劃進一步擴充套件其能力，例如支援更多工型別（如關係抽取）、最佳化規則生成策略，以及增強與人類協作的介面。這一工作為連線神經符號推理和實際NLP部署提供了有價值的橋樑。