AI News HubLIVE
站内改写1 分で読了

Caddy Defender プラグイン:AIクローラーにゴミデータを返す

Caddy DefenderはCaddy用ミドルウェアで、IP範囲フィルタリングと複数のレスポンダー(ゴミデータ返却、レート制限など)を用いて、AIクローラーやクラウドサービスのリクエストをブロックまたは操作し、トレーニングデータの収集を防ぎます。

ソースHacker News AI著者: hamburgererror

Caddy Defenderは、Caddy Webサーバー向けのミドルウェアプラグインで、AIクローラーやその他の望ましくない自動化ツールからのリクエストをブロックまたは操作するために設計されています。AI企業がモデル訓練のためにウェブデータを大規模にスクレイピングする中、このプラグインはサイトコンテンツの悪用を防ぐ効果的な手段を提供します。

中核機能はIP範囲フィルタリングです。OpenAI、DeepSeek、GitHub Copilot、AWS、Google Cloudなどの主要AIサービスのIPアドレス範囲がプリセットとして組み込まれており、ユーザーはCaddyfileでカスタム範囲を追加することも可能です。対象IPに一致したリクエストに対し、管理者は403応答(Block)、カスタムメッセージ(Custom)、接続切断(Drop)、AI訓練データを汚染するためのゴミデータ返却(Garbage)、指定URLへのリダイレクト(Redirect)、レート制限(Ratelimit)、または低速データ転送でクローラーを停滞させるTarpitなど、複数の応答方式を選択できます。

インストールは、公式Dockerイメージを使用するのが最も簡単です。イメージをプルし、Caddyfileをマウントして実行するだけです。その他のインストール方法はオンラインドキュメントを参照してください。設定構文は簡潔で、Caddyfile内にdefenderディレクティブを追加し、レスポンダーと必要に応じてIP範囲を指定します。

このプロジェクトはGitHub上でオープンソース(MITライセンス)として公開されており、550以上のスターと20のフォークを獲得しています。コミュニティはAlibaba Cloud、Oracle、Cloudflareなどの新しいIP範囲を積極的に追加しています。Tor出口ノードやASN範囲のIPセットはデフォルトで無効であり、ビルド時に手動で組み込む必要がある点に注意してください。Caddy Defenderは、AIによるデータ収集が増加する現在、コンテンツのセキュリティと著作権を重視するサイトにとって実用的なツールです。