ファンフィクションコミュニティはAIと、そして自分自身と戦っている
過去1週間、生成AIを使用する作者を追放することを目的とした新しいファンワーク運動が始まりました。しかし、採用された検出方法には疑問があり、どんなファンフィクション作家も巻き添えを食う可能性があります。匿名アカウントが、Claudeで生成されたテキストの痕跡を検出するAO3用スキンを公開したことで、フラグが立てられた作品の作者が公に非難される事態に発展しました。しかし、このツールには限界があり、普遍的に信頼できるAI検出技術は存在しません。コミュニティは分断され、無実の作家が犠牲になる可能性があります。
過去1週間、ファンワークコミュニティで新たな運動が始まりました。その目的は、生成AIを使用している作者を追い出すことです。しかし、導入されている検出方法には疑問が多く、どのファンフィクション作家も巻き添えになる可能性があります。
Claude、ChatGPTなどのAIツールの使用に対する広範な嫌悪感は、ファンフィクションの世界を含むクリエイティブコミュニティで長年にわたって存在してきました。読者と作家は、AI生成とされる作品を見つけるためのヒントを共有してきました。エムダッシュから、いわゆる紫の散文の広い概念まで、あらゆるものが引用されてきました。しかし6月29日、@heatedrivalryaiという匿名のXアカウントが、より信頼できると思われる解決策を約束しました。それは、人気のファンフィクションリポジトリArchive of Our Own(AO3)用のスキンで、AnthropicのClaudeボットが残すコードの痕跡を特定すると称するものでした。
「Claudeで生成された応答がClaudeからAO3に直接貼り付けられると、テキストはClaudeが注入したコード‘font-claude-response-body’で囲まれます」と@heatedrivalryaiアカウントは述べました。「その存在は、Claudeの使用を決定的に示します。」ユーザーがこのコードを含むページ(ファンフィクション作品など)にアクセスすると、スキンは背景全体を赤に変えます。
AO3では、このスキンが機能するかどうかをユーザーが確認できるように、いくつかのテスト投稿が公開されています。私自身がこれらの例に対してスキンをテストしたところ、画面はすぐに赤くなりました。念のためにClaudeで生成した短編小説を公開して独自の実験を行ったところ、チャットボットからエディタに直接貼り付けた場合は赤い画面が表示されましたが、同じ生成ストーリーでもClaudeから直接コピーしたものではないテキストを貼り付けると赤い画面は消えました。
このClaude検出器の投稿には、その痕跡が発見されたファンフィクションの例が添付されており、匿名の作成者は、これはシステムが機能することを示すためのものであり、「不信感の環境を作り出したり、特定のユーザーを非難したりするためではない」と述べました。しかし、ファンフィクションコミュニティは迅速に動員され、このツールによってフラグが立てられた作品の作家を公に名前を挙げて非難しました。その作成者は確かにAIを肯定的なものとは考えていません。「ファンダムは独特の、協力的な空間です。それは人間性と、それを駆り立て、それから栄養を得る創造性の火花によって繁栄します。もし無意識のうちにAIがこれらの空間を腐敗させることを許せば、何が残るでしょうか?」と彼らは語りました。
Anthropicは、このファン制作のClaude検出器が説明通りに機能するかどうかを検証するよう求める私の要請に応じませんでした。しかし、方法論は確かに妥当に見え、私たち自身のテストもそれを裏付けています。ボットが何らかの形で使用されなかった場合にClaudeのコードがストーリー内に存在する理由は明らかにありません。しかし、偽陰性と過度な一般化の両方の明確なリスクがあります。
コードのラッピングは、テキストがClaudeからAO3のエディタに直接コピーされた場合にのみ保存されるため、Google DocsやMicrosoft Wordで編集されてからAO3に移動されたものは捕捉されません。生計のために執筆している者として、CMSに直接書き込むことがどれほど危険かを証言できます。フラグが立てられた一部の作家は既に作品を更新して痕跡を削除しており、将来の作品はこのツールを簡単に回避できます。
逆に、このタグは作品内でClaudeがどの程度使用されたかを明らかにしません。その真っ赤な画面は、ストーリー全体が完全にAI生成されたことを意味するかもしれませんし、あるいは作者が人間が書いた数文をスペルチェックや翻訳のためにClaudeに貼り付け、その後AO3に戻したことを意味するかもしれません。
それは一部のファンメンバーにとっては重要ではありません。彼らは生成AIのいかなる使用も、広範なクリエイティブコミュニティへの許しがたい裏切りと見なしています。多くの人々は、この技術の環境への影響や、オープンウェブ(おそらくAO3などのプラットフォームにアップロードされたファンワークを含む)をスクレイピングして訓練される方法について懸念を表明しています。
この特定のツールの適用範囲は限られています。AO3はファンワークを公開するための唯一のプラットフォームではなく、Claudeは数あるAIモデルのうちの1つに過ぎません。少なくとも1人の人物が、「Claude、Deepseek、および一部のChatGPT」の使用を検出できる別のコードを書いたと主張していますが、その解決策を公開したり、仕組みを説明したりしていません。私はGoogleとOpenAIに、自社のモデルがテキスト生成において同様の手段で検出可能な痕跡を残すかどうか尋ねましたが、回答はありませんでした。
実際、普遍的に信頼できるシステムが存在するとは驚くべきことでしょう。私はAI検出をめぐる問題について数年間報告してきましたが、私の知る限り、生成されたテキストと人間の手で打たれたテキストを区別する信頼できる技術的解決策は現在存在しません。C2PA Content CredentialsやGoogleのSynthIDのようなシステムは、画像、動画、さらには音声における生成AIの識別にある程度の進歩を遂げていますが、これらは目に見えない透かしやメタデータに依存しており、コピー&ペーストされたテキストには引き継がれません。
将来は変わる可能性があり、AI企業は内部で問題を解決する十分なインセンティブを持っています。初期のモデルはインターネットから無差別にスクレイピングされたテキストで訓練されており、人間の書き物がその合成版に取って代わられるにつれて、出力の精度を低下させる「モデル崩壊」シナリオのリスクがあります。
しかし今のところ、ファンダムコミュニティは依然として主に「匂い」に依存しています。ほとんどのファンフィクションはAO3スキンのようなツールで判断されるのではなく、特定の文構造(悪名高い「それはXではなく、Yだ」など)から花盛りの比喩の多用までを含む可能性のある「兆候」によって判断されます。(少なくとも、これまでのところファンダムでベンチが人間になった話はありません。)しかし、AIはしばしばそのように書くのは、実際の人間が書いたものに基づいて訓練されているからだということを忘れてはなりません。それは私たちを複製しようとしているのです。私は自分のAO3ブックマークを共有する勇気はありませんが、ChatGPT以前のインターネット時代に、この怪しげな嗅覚テストに合格しない過度に大げさなファンフィクションを確かに読んだことがあります。
AO3上のAI作品を区別するための最善の解決策は既に利用可能です。それは、このサイトの堅牢なタグ付けシステムです。「生成AIを使用して作成」タグが存在し、多くの作者はClaudeのようなツールの使用を開示するために実際にそれを含めています。しかし、それには正直な透明性が必要であり、バックラッシュを考えると正直になるインセンティブはほとんどありません。また、ファンフィクションは趣味であるべきであり、規制された産業ではないことを覚えておく価値があります。
真の人間主導の創造性からAIが目をそらすのを防ごうとするこれらの取り組みにより、許容可能な執筆品質と見なされるものに適合しない作者が、進行中の魔女狩りの無実の犠牲者になる可能性があります。少なくとも1人の作家が、自分が信頼して編集を依頼した他人がClaudeを使って編集したために、すでにこの騒動に巻き込まれています。ですから、次に読むファンフィクションが少しロボットっぽく感じられても、それが実際にはロボットの産物ではないかもしれないということを心に留めておいてください。