AIの10万のなぜ
著者は、人間が書いたテキストとAIが生成したテキストを区別する難しさについて論じ、LLMは統計的に区別できないかもしれないが、その準決定論的な性質により、Amazonに氾濫するAI生成児童書のように反復的な出力が生じると指摘する。非公式な場面では直感を信じてもよいと述べている。
人間が書いたテキストとAIが生成したテキストを見分けられるかという議論は、技術者の間で繰り返し発生する厄介な問題です。懐疑論は合理的な根拠に基づいています。大規模言語モデル(LLM)は、人間の話し方の最先端の統計モデルです。それならば、モデルの出力は統計的テストでは人間の言語と区別がつかないはずです。
著者は、この議論が常に誠実に行われているとは考えていません。少なくとも一部の議論は、自分たちの技術の不正使用を否認したい人々によって始められています。しかし、もしあなたがこの信念を誠実に持っているなら、次のコラージュをご覧ください。Amazonで「100000 whys」と検索すると表示される約150冊の児童書の表紙です。これらの本の中には児童文学のカテゴリでベストセラーになっているものもあります。これらのタイトルや表紙に人間離れしたものは何もありませんが、これらがAIが生成した「スロップ」(低品質コンテンツ)の純粋な形であることは明らかです。
ここで見られるのは、LLMが準決定論的であるという特性の結果です。同じプロンプト(例えば「子供向けの参考書を生成してください」)を与えると、おそらく80%の確率で機能的に同一の出力を生成します。コラージュ内の類似性はタイトルの選択をはるかに超えています。例えば、最上段のすべての表紙はデザインの左上隅に咆哮する恐竜を特徴としています。他にも赤と白の漫画のロケット、ゴールデンレトリバー、ライオンなど、繰り返し出現するクラスターが多数あります。
これこそがLLMによる文章の特徴です。モデルの個々の癖が人間と異なるからではありません。ほとんどすべての普通のプロンプトに対して同じ複雑な癖のセットに頼るからです。これはあいまいな信号なので、「これではない、あれだ」とインターンが言ったからといって解雇すべきではありません。しかし、よりカジュアルな場面では、直感を信じても構いません。実際、コンテンツを生成する労力が消費する労力よりもはるかに少ない場合、従来のオンライン交流モデルは崩壊するため、これらの本能はますます重要になっています。
追伸:もしLLMを使ってブログを自動化しているなら、確かにテクノロジーは素晴らしいですが、あなたの出版物が「100,000のなぜ」と改名される可能性が高いです。