2026-07-05 04:32 UTC+9サイト内リライト2 分で読了更新: 2026-07-05 04:40 UTC+9

AI文章パターン検出ツール：自身のREADMEを何度も指摘

AI生成テキストの36のパターンを検出し、リアルタイムで書き換えるオープンソースツール。付属のPython製リンターはCIに組み込み可能。

ソースHacker News AI著者: danishyar

AIによる文章作成が広まるにつれ、生成されたテキストに共通するパターンが問題視されるようになりました。最近公開された「humanize」というオープンソースプロジェクトは、この問題に取り組むものです。このツールは、AI支援執筆において頻出する36種類のパターンを検出し、文章をより人間らしくすることを目的としています。

多くの既存ツールは完成したテキストを後から修正しますが、humanizeは生成時点で介入することでパターンが出現するのを防ぎます。また、既存のテキストを貼り付けてクリーンアップすることも可能です。ツール自体はClaude Code、Cursor、GitHub CopilotなどのAIエージェントにスキルとして組み込むことができ、独立したPython製リンターも提供されます。

検出されるパターンには、否定並列（「これは単なるCRMではありません。販売の再考です」）、ルール・オブ・スリー（「速い、信頼性が高い、安全」）、偽の範囲（「スタートアップからグローバル企業まで」）、あいまいな帰属（「研究によると」）などが含まれます。各パターンには具体的な「修正前/修正後」の例が用意されています。

ツールの根拠は、Wikipediaの「AI執筆の兆候」プロジェクトや、1500万以上のPubMed抄録を分析したLLM過剰語彙に関する研究論文（arXiv:2406.07016、arXiv:2502.09606）に基づいています。

インストールは簡単で、専用CLIコマンド（npx skills add ...）で主要なAIエージェントに一括導入できるほか、手動でクローンしてSKILL.mdを読み込むことも可能です。Claude Codeではプラグインとしても利用できます。

使用する際は、生成モードでは自動的にメールや記事、マーケティングコピーなどの用途に合わせた文体が適用されます。書き換えモードでは、引用や数値、固有名詞はそのまま維持し、パターンのみを削除します。また、ユーザーの実際の文章サンプルから個人の文体を学習する「音声キャリブレーション」機能も備えています。

付属のリンター（scripts/ai_pattern_lint.py）はPython 3.9以降の標準ライブラリのみで動作し、ファイルまたは標準入力から読み取ったテキストを分析します。出力には各行のパターン種別と位置が含まれ、密度がしきい値を超えると終了コード1を返すため、CI環境に最適です。

このプロジェクトは、AIが生成する文章の質を向上させるだけでなく、開発者が自動的に品質管理を行える実用的なツールを提供しています。