次なる偉大な小説はAIによって書かれるのか(そしてあなたはそれを見分けられるのか)?
大規模言語モデルの使用疑惑が文学界とメディア界を揺るがす中、言語学者は人間の言語と機械の言語を本当に区別するものを説明し、ジェニファー・イーガンやジャネット・ウィンターソンを含む小説家たちはChatGPT時代におけるフィクションの未来について考察する。
3つのホテルのレビューから、どれがAIによって書かれたものかわかるだろうか? ランカスター大学の法語言語学教授クレア・ハーダカー氏によると、人々がこの種の判断を正しく下せるのは約60%の確率にすぎない。彼女のオンラインテスト「Bot or Not」では、15のレビューから偽物を見つけ出すことが求められる。この平凡な成功率は、AIの文章を一目で見分けられると確信している人々にとっては驚きかもしれない。今年5月、ジャミール・ナジールの受賞短編の信憑性に疑問が呈されたとき、ソーシャルメディアのユーザーは即座に非難した。「知っている人は知っている」とあるユーザーはコメントした。
ハーダカー氏によれば、回答者はAIの言語を見分けるために、決まり文句の存在やダッシュの使用など、いくつかの単純な経験則に頼る傾向がある。単語やフレーズが満足のいく3つのグループに配置される「3の法則」もAIの特徴と考えられている。「人々は非常に単純なルールを学び、それをあらゆる場所に狂ったように適用している。」
しかし問題は、これらの「特徴」は人間の文章にも見られるものであり、結局のところ大規模言語モデルは人間の文章を学習しているということだ。「チャールズ・ディケンズにまで遡って、彼はAIを使っていたと言える。なぜなら彼も長いダッシュを使っていたからだ。」そして、ユリウス・カエサルが「Veni, vidi, vici」と言って以来、演説家たちは3の法則を知っている。私たちのホテルレビューの例では、最初のものだけが本物だった。あなたは見分けられただろうか?
確かめるのが非常に難しいからこそ、疑念が日常的になっている。文学界では、AI使用の告発が作家たちを悩ませており、その正当性は様々だ。処女作ホラー小説『Shy Girl』は、著者がAIに依存したという噂がネット上で広まった後、出版社のHachetteによって撤回された(著者は否定している)。スティーブン・ローゼンバウムの著書『The Future of Truth』は、「AIがいかに現実を再形成するか」を真剣に研究したものだが、多数の幻覚引用を含んでいることが判明し、著者は謝罪の中で認めた。
『ガーディアン』を含むメディア組織は、AI生成テキストと思われるものに対する苦情が増加している。これには特定の言い回しに関する直感も含まれるが、タイプミスや文法エラーに関するコメントも含まれる。あるケースでは、「after」という単語が文の中で意図せず重複していた。「人間の編集者/校正者がこんなものを見逃すとは想像できない」とある読者は書き、私たちの編集能力に対する感動的な信頼を示した。
問題は、AIが人間の文章で学習するだけでなく、人間もスタイル的にAIの影響を受けており、その相互作用が言語の鏡の迷宮を作り出していることだ。著者が認めない限り、個々の文章がAIかどうかを確実に言うことは困難だ。この不確実性はパラノイアの原因となる。
そして、人間と機械を区別するために市販の検出ツールに手を伸ばしたくなるとしても、それにも不確実性が伴うとハーダカー氏は言う。「私たちの中には、自然にAIのように見える書き方をする人がいる」——彼女は例えば神経多様性の人々を挙げる——「その場合、AIとして検出される。また、AIの出力をより人間らしく見せるように修正することもできる。その種のコンテンツをAI検出器に入れると、奇妙な結果が得られる。」法廷で専門家証人を務めた経験を持つ彼女は、その有効性について「極めて懐疑的」だ。
新たに人気を博した検出器Pangramは、誤検出率が約1万分の1と謳われており、独立したテストでは、AIの文章が「ヒューマナイザー」アプリで偽装されていても、高い効果を示している。しかし疑問は残る。私は初回の試みでこれを騙すことができた(下のスクリーンショット参照)。大げさな調子を真似ることで、それはAIの特徴かもしれないが、自然に大げさなスタイルを持つ人の作品、あるいはChatGPT、Claude、Geminiを動かすLLMの出力に浸かった作家の作品でもあり得る。それはますます私たち全員に当てはまる。
現在、毎日膨大な量のAI文章が出版されている——広告コピーから学術要旨、フィクションまで。同時に、自動生成されたメールの提案、「AI概要」検索結果、チャットボットの応答を通じて、私たちの生活にますます大きな影を落としている。このレベルの露出において、問題はAIが言語を変えているかどうかではなく、どのように変えているかである。そして、私たちは抵抗すべきか、それとも受け入れるべきか?
LLMが生成するテキストは平均して人間の文章とわずかに異なることがあると、私たちは以前から知っている。多くの場合、それは大量の資料を見たときにのみ明確になる。ある鋭い研究者は、2024年に科学論文のデータベースを検索した後、「delve」という単語の突然の人気をLLMと結びつけた。AIが過剰に使用する傾向がある他の「焦点語」には、「showcase」、「boast」、「underscore」、「garner」、「align」、「surpass」、「intricate」が含まれる。しかし繰り返すが、個々の文章が全く無害にこれらの語彙を使うこともあり得る。
さらに複雑なことに、「delve」現象はモデル自体ではなく、人間による評価と誘導のプロセス(「人間のフィードバックによる強化学習」)に起因する可能性があると考える研究者もいる。「低賃金でストレスが多く、時間的プレッシャーがかかる」労働者にとって、「特定の単語が品質の代理として扱われ」、モデルはそれらをより頻繁に使うように無意識に訓練される。言い換えれば、「delve」の急上昇は、それがAIが使いそうにない単語であるという事実に起因するかもしれない。(別の説では、多くのRLHF労働者が住んでいたナイジェリアで使われる英語の特徴であるため頻繁に登場したとされるが、データはそれを裏付けていない。)
他にも区別できるパターンがある。LLMは名詞を好むが、代名詞の使用は人間より少ない。これは、私たちのような社会的生き物ほど自分自身や他者について語らないことを反映しているかもしれない。LLMは限定形容詞(「不快な椅子」)を好むが、叙述形容詞(「椅子は不快だった」)は好まない。おそらく、情報を小さく密集したパッケージで届けることを好む一方、私たちはより拡散させるからだ。異なるモデルには明確な癖があり——それは「方言」と呼ぶこともできる——Geminiは「here's a breakdown」と言うのを好み、Deepseekはしばしば陽気な「Certainly!」と応答する。世界中のフォーマルな英語を編集するよう求められた場合、AIは英米標準に向けて平準化・均質化する傾向があり、研究者はこれを「文化的ゴースティング」と呼んでいる。したがって、インドのプロフェッショナル英語で完全に許容される「Kindly do the needful & revert back at the earliest」は、「Please complete the task & respond promptly.」に「修正」される。
LLM語が「現実」世界に漏れ出し、AIがいない環境での人間の言語使用を変えているという証拠が今や続々と出てきている。ある研究では、数千の即興会話を分析し、ChatGPTのリリース後に「delve」や「boast」などの単語が急増したことが判明した。別の研究では、ソーシャルメディアで槍玉に挙げられた後、学術要旨における「delve」の頻度が実際に低下したことが示され、AIの影響が複雑な形で現れる可能性があることを示唆している。
これは重要だろうか? 言語は常に変化している——単語は流行ったり廃れたりし、新しいテクノロジーは常にその背後にある力の一つだった。しかし、AIは特に高いレベルの不安を生み出しているようだ。なぜか? 「私が思うに、人々を怖がらせるのは、意識への侵入、新しい人間になるという考えだ」とハーダカー氏は言う。2023年以来、彼女はBot or Notプロジェクトを音声と音楽に拡張し、人々が楽しんだ曲が機械によって作曲・演奏されたと判明したときの反応がどれほど本能的であるかに気づいた。
コロンビア大学でクリエイティブライティングを教える小説家ゲイリー・シュテインガート氏も、AI文学の見通しに対する学生たちの同様の強い感情に気づいた。「私の大学院生の一人が『実験として、この作品の一部をAIで書こうと思う』と言ったとき、他の学生たちは非常に怒り、私に手紙を書いて、これがどれほどひどいことか訴えた。」
「作家と読者の間には暗黙の契約があり、あなたが得ている作品が人間によって生成されたものであることを知っている。そしてそれはその契約への攻撃だと感じられたのだと思う」と彼は言う。「文学小説を読むことは、別の人間との驚くべきバルカン精神融合であり、誰かの意識に入り込むことだ。AIの場合、私は他人の意識のシミュラークルに入り込むことになる。一段階、あるいは何段階も隔たっている。それに比べて、なんと悲しいことだろうか?」
ハーダカー氏にとっては、「それはおそらく、私たちを特別で価値がありユニークなものにするものへの侵害だと思う」。同時に、彼女が使用している音楽生成モデルは「絶対的な名曲をいくつか生成している。私はそれを、皮肉ではなく、自分の車で聴き、非常に楽しんでいる。」
同じことが文学にも起こり得るだろうか? 機械が書いた小説が、いつか史上最高の100作品に名を連ねる日が来るのだろうか? ノッティンガム大学の文学言語学教授ピーター・ストックウェル氏は、AIは基本をこなすことはできても、高みには登れないと考えている。「非常に馴染み深く、非常に凡庸で、完全に機能的なものが欲しいなら、それは驚くほど得意だ。」
言語を考える一つの方法は、一連の層として捉えることであり、最下層に単語があり、その上に句、節、複文、そして物語構造まで続くと彼は言う。「AIは低い層では非常に優れている。私たちの統語構造の多くを学習しており、すべてが整形式で文法的に見える。しかし、上に行けば行くほど、その能力は低下する。」物語の弧をAIが説得力を持って描くことは特に難しい。
「AIに物語を書かせると、一連の出来事を持ち、最後に何かが起こるというかなり良い仕事をすることができる。しかし、それは非常に語るに値しない物語だろう」と彼は続ける。「驚くべきことや面白いことは何も起こらない。そしてもし何か驚くべきことがあれば、それは通常、素晴らしいひねりではなく、間違いのように見えるだろう。」
偉大な文章の秘訣は、それを研究する学者にとっても秘密のままだ。「言語学者は、言語がより高いレベルでどのように機能するかを実際には理解していない」と、談話、ストーリーテリング、魅了のレベルで。「私たちは、それがどのように機能するかわからない機械を構築することはできない。」それが何に帰着するかについての手がかりはある——それは私たちの根本的に社会的な性質と、それに関連して、私たちが「ウェットウェア」であるという事実——アドレナリンのスパイク、ドーパミンのラッシュ、社会的接触への渇望を持つ人間の肉体であり、それらすべてが言語の構造とその使用法に表現されている。