AI News HubLIVE
站内改写2 分钟阅读

用正则表达式和斯蒂芬·金检测AI废话:Tacheles

Tacheles是一款开源的AI写作检查工具,通过正则表达式和统计学方法检测AI生成文本中的常见模式,如冗余词汇和特定句式。它提供精确的行级反馈,帮助作者去除AI痕迹,保持个人风格。支持多语言,完全离线运行。

来源Hacker News AI作者: shtofadhor

Tacheles 是一款开源的 AI 写作检查工具,旨在帮助写作者识别并去除 AI 生成文本中的常见“痕迹”。它不同于传统的 AI 检测器——后者通常返回一个模糊的百分比评分,而 Tacheles 像代码检查器一样,直接在文本的特定行标记出问题,并附上修改建议。这些建议源自知名编辑和作家的写作原则,例如斯蒂芬·金的《写作这回事》以及俄罗斯编辑伊利亚霍夫和诺拉·加尔。工具完全离线运行,无需 API 密钥,确保隐私和可重复性。

Tacheles 将 AI 写作中的“废话”归纳为两类:冗长和风格。由于语言模型逐词生成最可能的词,它们倾向于添加多余的词汇;同时,它们也使用特定的句式,如“不仅仅是 X,更是 Y”以及大量使用破折号。Tacheles 能精准定位这些模式,并给出修改理由。例如,它会标记“delve”、“robust”等 AI 高频词,以及“It's not about X, it's about Y”等句型。用户根据提示进行删减后,文本会变得更简洁、自然。

与传统工具相比,Tacheles 提供的是一份“裁剪清单”而非单一分数。它还能针对不同写作模型(如 Claude 和 GPT)进行检测,因为不同模型有不同的语言习惯——Claude 偏爱节奏性强的句式和破折号,GPT 则倾向使用特定的词汇和框架。Tacheles 不试图判断用了哪个模型,而是无论哪种模型产生的废话都予以标记。

工具的安装非常简单:只需运行 npx tacheles check draft.md 即可。它内置了多个配置文件,包括论文、技术文档、咨询等风格,用户还可以根据个人写作习惯调整灵敏度。Tacheles 还附带一个可移植的 SKILL.md 文件,可以在 Claude Code 等环境中实现检查、重写、再检查的完整工作流。

Tacheles 的检测规则全部以数据形式存储在 registry.json 中,目前包含 43 个活跃的“痕迹”检测器,按表面、节奏和简洁度分类。每条检测结果都有 HIGH、MEDIUM 或 LOW 三个严重级别,HIGH 级别的会直接导致检查失败(退出码 1),从而可集成到 CI 流程中。

总的来说,Tacheles 为 AI 辅助写作提供了一种细致、可操作的优化方式,帮助作者在保留个人风格的同时产出更干净、更自然的文本。对于追求写作质量的技术写作者和内容创作者来说,这是一个非常有价值的工具。