AI文章パターン検出ツール:自身のREADMEを何度も指摘
AI生成テキストの36のパターンを検出し、リアルタイムで書き換えるオープンソースツール。付属のPython製リンターはCIに組み込み可能。
AIによる文章作成が広まるにつれ、生成されたテキストに共通するパターンが問題視されるようになりました。最近公開された「humanize」というオープンソースプロジェクトは、この問題に取り組むものです。このツールは、AI支援執筆において頻出する36種類のパターンを検出し、文章をより人間らしくすることを目的としています。
多くの既存ツールは完成したテキストを後から修正しますが、humanizeは生成時点で介入することでパターンが出現するのを防ぎます。また、既存のテキストを貼り付けてクリーンアップすることも可能です。ツール自体はClaude Code、Cursor、GitHub CopilotなどのAIエージェントにスキルとして組み込むことができ、独立したPython製リンターも提供されます。
検出されるパターンには、否定並列(「これは単なるCRMではありません。販売の再考です」)、ルール・オブ・スリー(「速い、信頼性が高い、安全」)、偽の範囲(「スタートアップからグローバル企業まで」)、あいまいな帰属(「研究によると」)などが含まれます。各パターンには具体的な「修正前/修正後」の例が用意されています。
ツールの根拠は、Wikipediaの「AI執筆の兆候」プロジェクトや、1500万以上のPubMed抄録を分析したLLM過剰語彙に関する研究論文(arXiv:2406.07016、arXiv:2502.09606)に基づいています。
インストールは簡単で、専用CLIコマンド(npx skills add ...)で主要なAIエージェントに一括導入できるほか、手動でクローンしてSKILL.mdを読み込むことも可能です。Claude Codeではプラグインとしても利用できます。
使用する際は、生成モードでは自動的にメールや記事、マーケティングコピーなどの用途に合わせた文体が適用されます。書き換えモードでは、引用や数値、固有名詞はそのまま維持し、パターンのみを削除します。また、ユーザーの実際の文章サンプルから個人の文体を学習する「音声キャリブレーション」機能も備えています。
付属のリンター(scripts/ai_pattern_lint.py)はPython 3.9以降の標準ライブラリのみで動作し、ファイルまたは標準入力から読み取ったテキストを分析します。出力には各行のパターン種別と位置が含まれ、密度がしきい値を超えると終了コード1を返すため、CI環境に最適です。
このプロジェクトは、AIが生成する文章の質を向上させるだけでなく、開発者が自動的に品質管理を行える実用的なツールを提供しています。