プロンプトは作品ではない:AIの貢献を説明する
生成AIの時代に、人間の貢献をより正確に記述するための語彙が必要である。現在の「AI生成」ラベルは、単なる承認から深い反復作業まで、異なる関与度を区別できない。本稿は、発案、指示、改訂、検証、承認を区別する「貢献文法」を提唱する。
生成AIの時代、私たちは貢献を説明するためのより良い語彙を必要としている。オフィス、グループチャット、コメントセクションで繰り返される瞬間がある。誰かが文章、デザイン、コードを共有し、別の誰かが半分冗談で半分敵意を込めて「これはAIが書いたのか?」と尋ねる。この質問は著者について尋ねているように聞こえるが、実際には貢献について尋ねている。あなたが発案したのか、指示したのか、修正したのか、検証したのか、あるいは単にリリースしたのか?これらは五つの異なる答えであり、提供されている二択(「はい」と「いいえ」)には切実に必要な表現力が欠けている。
著者と所有権に関する壮大な新しい理論は、混乱、難解な学術論文、そしてへそくりを生み出す。より有用なプロジェクトはより小さく、より社会的である。私たちは日常言語——「貢献文法」と呼びたければそう呼んでもいい——が必要である。それは作品がどのような人間の関与を表しているかを説明するためのものだ。現在の言語の失敗は、道徳の前に表現の失敗である。誰かが貢献について嘘をつくずっと前に、正直な人々が誤って誤解させたり、沈黙したりする。なぜなら彼らは自分の貢献を説明する言葉を持っていないからだ。法律、出版、学術界はすでに独自の語彙を構築中だが、他の私たちは、誰かが文書を見つめて、それがどのように作られたのか疑問に思うときに、実際に尋ねられる質問(「これはAIが書いたのか?」)に答えられればよい。
「AI生成」は悪いラベルである。「AI生成」は現在、サプライチェーンのレジリエンスについて2000語書いてと入力し、出力を読まずにLinkedInに貼り付けた人をカバーする。また、アーキテクチャを詳細に説明し、モデルにコードをドラフトさせ、すべての関数をレビューし、二つのアプローチを拒否し、競合状態を発見し、エラーハンドリングを書き直した開発者もカバーする。モデルと三時間議論し、修正し、破棄し、最終テキストには初稿の一文も含まれていない作家もカバーする。五十枚の画像を生成し、その中から一枚を厳選し、写真と合成したアーティストもカバーする。このラベルは説明力に深刻に欠けており、実際に何が起きたかを明らかにするのにひどい。なぜなら「考えを整理する手助け」と「私の代わりに考えて」の両方をカバーするからだ。
これらのプロセスは根本的に異なる。費やされる努力の量、誠実さのレベル、所有権のレベル、知的貢献のレベルが異なる。基本的に異なる自律性の行使レベルである。それらを同一に扱うラベルは役に立つ開示ではなく、さらに悪いことに、通常は道徳的告発と組み合わされる。「AI生成」は現在、非難として機能しているため、人々は自分のプロセスを隠すか、過度に告白する。どちらの反応も作品について有用なことを教えてくれない。
これは仮説ではない。科学論文の著者を研究する研究者たちは、これを「透明性のパラドックス」と呼び始めている。モデルを使って数文を引き締めた著者は、プロンプトから全セクションを生成した著者と同じ開示スティグマに直面するため、著者は有用なツールを避けるか、黙っている。証拠は、非開示が主に不確実性に起因することを示している。現在の語彙では、正直な開示でさえ、明らかにするのと同じくらい隠蔽する。
タイピングは常に悪い代理指標だった。私たちが行き詰まっている理由の一つは、単語単位の生産を貢献の黄金基準として静かに扱ってきたことだ。本当の著者は文を作った指を持つ人である。しかし、その基準はAI以前から一貫していなかった。編集者は原稿を徹底的に変えることができ、出版された本は協力の産物と言えるが、カバーには一人の名前しか載らない。巨匠たちは見習いに退屈な細部を埋めさせた。政治家が自ら回顧録を書くとは誰も期待していない。
したがって、私たちはすでに貢献が様々な形で現れることを知っている。アイデアを発案する、実行を指示する、選択肢を選ぶ、洗練する、検証する、承認する。しかし、これらを区別する日常言語が切実に必要とされることはなかった。なぜなら、すべての形は努力を伴い、努力がすべての代理となり得たからだ。努力のない生成はその代理を壊す。今や記述すべきは自律性である。誰の指が文を作ったかではなく、誰が文がどうあるべきかを決めたかである。
希少な貢献は判断力である。AI画像の六本指の手は恥ずかしい。機械が作ったからではなく(今や誰もが機械が作ったことを知っている)、誰も確認する手間をかけなかったからだ。失敗は生成の失敗ではなく、判断力とセンスの失敗であり、判断力とセンスこそ人間が提供すべき貢献だった。
機械が流暢なテキスト、妥当なコード、洗練された画像をオンデマンドで生産できるなら、流暢さ、妥当性、洗練はもはや人間の努力の証拠ではない。「ChatGPTが書いたのか」という質問が本当に探っているのは、これにあなたの判断力、専門知識、センスがどれだけ含まれているか?これはあなたが実際に意図したものか?AIが起草したコードを承認する開発者は(願わくば)主張している:私はこれを読み、理解し、午前3時に壊れたときに責任を取る、と。
だからこそ「AIが書いた」と「AIが書いたが確認した」は同じ文であってはならない。後者には希少な資源全体が含まれている。
作品は反復の中にあるかもしれない。AI支援ライターに向けられたよくある難癖がある。Clayton Ramseyの「プロンプトだけ見せてくれ」が現在の形だ。論旨は、LLMの出力はプロンプトにすでに含まれていたものに何も追加しないので、プロンプトだけ送ればよいというもの。プロンプトを考えること自体が作業であり、それ以降はおまけに過ぎない。ChatGPTのウィンドウでエンターキーを押すことに貢献はない。彼が描写する怠惰なケース(一つのプロンプト、一回の貼り付け)には確かに当てはまる。彼の反論は「私がこれを作った」が「私はこれをリクエストし、これが返ってきた」を意味する場合には見事に当たる。しかし、それは決してLLM拡張生成の全クラスに触れない。そこでの貢献は「私がこれを作り上げた」である。
プロンプトは単なる出発点になり得る。その後努力が費やされるとき、その努力は後続のシーケンスに宿る。反論、修正、拒否、洗練、受け入れ。モデルと十ラウンド行った人は、決定の痕跡を残している。それぞれの決定はテキストのいくつかのバージョンにノーと言い、他にイエスと言った。最初のプロンプトを送っても、最終的な成果物についてほとんど何もわからない。最初のアウトラインを送っても、公開されたエッセイについてほとんどわからないのと同じだ。反復は本当の作業の回り道ではなく、しばしばそれ自体が本当の作業であり、私たちはまだその作業を説明する有用な方法を持っていない。
承認は無視できない。もう一つ軽視されがちな貢献がある。単なる署名である。誰かが自分の名前でテキストを公開し、「これは私の見解を表す」と言うが、文の大部分はモデルが生成した場合、ゴム印と呼ぶのは簡単だ。しかし、それは無ではない。誰もが自分の考えを表現する言葉を持っているわけではなく、他の誰かが見つけたときに認識することはそれ自体表現の行為である。それ以上に、承認は実際の結果を伴う。承認者は自らの信頼性を賭し、エラーに対する責任を受け入れ、内容が意図と一致していると主張する。人々が機械が起草した声明を正確に承認する世界は、誰も責任を取らないテキストを共有する世界とは意味が異なる。
承認は明らかに著者そのものではない。署名は遡及的には作品を生み出さない。そしてそれは最も薄い貢献の主張である。署名するものは読んでも読まなくても署名でき、「すべての行を確認した」とは異なり、プロセスを説明せず、立場だけを示す。それだけでは、見知らぬ人からはほとんど何も教えてくれない。
しかし人は嘘をつく。上記すべてへの明白な反論は、これらの細かい声明は検証できないということだ。「すべての行を確認した」と入力するのは偽造するのと同じくらい簡単だ。それは真実だが、要点ではない。主張は検証可能でなくても有用であり得る。「ざっと読んだ」は検証不可能だが不可欠であり、「契約書を読んだ」「もうすぐ終わる」もそうだ。私たちは確かに、強力な努力シグナルを失った今でも、評判と結果を使って嘘を取り締まり続けるだろう。しかし、嘘ではないものは取り締まれない。適切な言葉を持たない正直な人である。「私が書いた」と言って詐欺師のように感じるか、「AIが書いた」と言って一週間の作業を過小評価する人だ。言葉の欠如の問題が先であり、語彙だけが解決できる問題である。
貢献文法に向けて。日常の問題は今や扱いやすいと感じられ、より凝った説明が必要な場所では、文法はすでに現れている。学術出版は四段階の開示フレームワークやGAIDeT、AIDという名前の分類法を芽生えさせている。オープンソースプロジェクトは、プルリクエストでコードが完全にAI生成だが人間レビュー済みか、大部分AI生成か、大部分人間作成かを宣言することを要求し始めており、コミットメッセージには「Assisted-By:」トレーラーが現れている。これらすべては形式的、制度的、やや扱いにくい。そして、人々が定期的に貢献を説明せざるを得ない場所では、そのための言葉を構築するという証拠である。欠けているのは会話層である。コンプライアンスフォームではなく、Slack返信のための言葉だ。
それらの言葉は安い。私たちは単に自分が何をしたかを言い始めればよい。私はこれを指示した。モデルで起草して書き直した。すべての行を確認した。多くの試みからこれを厳選した。私はこれを承認する。書いたのは私ではない。
それは理論ではない。単なる区別——著者、努力、判断、承認の間の——を、私たちが日常会話で互いに使えるようにしたものだ。「人間作」対「AI生成」という二択は、圧力の下で迅速に作られたその文法の初稿だった。そして初稿は改訂されるべきだ。
(記事の最後に、作者自身の貢献の声明があり、テキストがどのように作成されたかが説明されている。)