AI News HubLIVE
サイト内リライト5 分で読了

ウェブコンテンツがAI生成かどうか気にしない

著者は、AI生成コンテンツに対する一般的な不満(不正確、非本物、開示不足)を検討し、人間のコンテンツにも同様の問題があると指摘する。すべてのオンラインコンテンツは、その価値に基づいて評価されるべきであり、AIも将来信頼できる情報源になり得ると論じる。

ソースHacker News AI著者: speckx

最近、私は「小さなネット」や「小さなウェブ」に人々が関心を持っていることに気づきました。主流のウェブ上に大規模言語モデル(LLM)などで生成されたコンテンツが氾濫していることにうんざりしているからです。彼らは「AIの粗悪品」、つまり質が低く、手抜きで、独創性のないコンテンツを嘆いています。主流のウェブにはこの種の素材が多くありますが、作者が隠されていることが多いため、正確な量を把握するのは困難です。今では「粗悪品」が「小さな」ウェブにも現れ始めており、かつての避難所ではなくなるかもしれません。

私はAI生成コンテンツに対して本能的な嫌悪感を認めますが、その理由をうまく説明できません。しかし、AIに悩む多くの人々も理由を説明できないことに気づきました。彼らが説明しようとするとき、最もよく聞く不満は、AI生成コンテンツが不正確である、または「非本物」である、あるいは作者にAIが使用されたかどうかが不明確である、というものです。

正確性について:確かにAIコンテンツはしばしば不正確ですが、人間が生成したコンテンツも不正確であることがよくあります。ソーシャルメディアは特に、綿密な調査を欠き、ニュアンスに欠ける素材が多くあります。時には意図的な誤情報もあります。LLMは誤った情報を生成することがありますが、それはそのような素材で訓練されたからです。私の知る限り、LLMは(まだ)悪意を持って行動することはできません。不道徳は人間の心の特別な創造性を必要とします。

実際、LLMは大量の情報を集約し要約するのが非常に得意です。確かに識別力に欠けます。つまり、微妙な意味の違いを区別できません。しかし、率直に言って、多くの人々も読解において十分に分析的ではありません。情報の批判的評価は十分に広く、若い年齢から教えられていませんが、教えられるべきです。

非本物性について:最近、ウェブフォーラムで、30年間連れ添った夫が書いた、がんで勇敢に闘い最終的に成功しなかった女性の感動的な記事を読みました。涙が乾く前に、同じ文章が少なくとも3つの異なる場所で異なる名前で掲載され、「AIの粗悪品」だと誰かが投稿しました。私は気づきませんでしたが、そのようなものに嗅覚のある人々は兆候を認識できるようです。

なぜこのようなものが不快なのでしょうか?このAI生成の物語は、LLMの訓練データから派生した実際の人間の経験を集約したという意味で真実でした。実在の名前を持つ人間が痛みと喪失を経験していたわけではありませんが、残念ながらそのような人々は存在します。もし物語が人間によって直接書かれていたとしても、その作者が私の知人で、すべての詳細が真実だと確認できるとは限りません。

つまり、この物語が私に与える影響は、誰が何を書いたかに関係なく同じだったでしょう。では、なぜAI生成だと問題があるのでしょうか?根本的に、私たちは実在しない誰かに共感させられるのを好まないのだと思います。いや、私たちはそれを好みます:フィクションではそれが好きです。ただ、物語が事実であると主張する場合には嫌なのです。共感には感情的なエネルギーが必要です。なぜ作家が完全な見知らぬ人であってもそうなのか、私はまだ理解に苦しんでいます。

さらに理解に苦しむのは、人々がフィクションであってもAI生成コンテンツは非本物だと主張することです。フィクションは本質的に非本物であり、誰が書いても同じです。チャールズ・ディケンズが実際にギロチンで処刑されるのを待った経験があるとは思いませんが、『二都物語』がフィクションであるため、彼がまるで経験したかのように書いたことを批判しません。別の人の経験を生きることは小説家にとって重要なスキルです。

もちろん、LLMには経験がありません。しかし、LLMができることは、人間の作家の経験を集約することです。このプロセスの結果は少し退屈かもしれませんが、他のフィクション作品と同様に本物です。

開示の重要性:多くの人々にとって、AIが使用されたかどうかを知ることは重要です。彼らはAIが使用されたことを知りたいのは、それによってコンテンツを読まなくて済むからだと思います。不正確または「非本物」である可能性が高いと思えば、スキップすることで時間を節約できます。

中には、原則としてAI生成コンテンツを読まない人もいます。AIが雇用を奪っていると考えるなら、完全に避ける理由がわかります。先週、データベース企業のOracle社が従業員の10%を解雇し、その理由として「AIの普及」を挙げました。AIが補償するだけの新しい雇用を生み出すかどうかはまだ不明です。

いずれにせよ、私が今朝のニュースのAI生成要約を読むか、スキップしてより人間的なものを探すかは、IT業界でのAIの普及を変えるとは思いません。それでも、AIの敵対的買収に加担したくないという反対派の気持ちは理解できます。

したがって、多くの人々が知りたいと思っている以上、出版社がAIがどのように関与したかを示すのは単なる常識だと思います。

しかし、私にとってはあまり重要ではありません。

なぜ気にしないのか:ウェブベースの出版におけるAIに関する不満には少なくともいくつかの正当性があるように思えます。では、なぜ私は特に心配していないのでしょうか?

私の場合、すべてのオンラインコンテンツを2つのクラスに分けています:私が信頼する既知の個人(または組織)によって書かれた素材と、その他すべてのものです。比率は約1:1000です。「その他」のカテゴリでは、人間とAI生成コンテンツを実際には区別していません。すべてがそれ自身の価値に基づいて評価されます。一部のAI生成コンテンツは有益で楽しいですが、多くはありません。しかし、人間生成コンテンツも同様です。人間生成コンテンツが先験的にAIコンテンツよりも正確である可能性が高いと仮定するのは重大な誤りだと思います。詳細な精査なしに信頼できる素材を生み出す個人は非常に少なく、どの作家も私の信頼リストに入るまでには長い時間がかかります。

いつかはAIエージェントも「信頼できる既知の個人」のカテゴリに含まれるかもしれないと考えるのはもっともだと思います。AIが一貫して真実で有用で面白い情報を生み出すなら、実用的な目的でいつかそれを「個人」として受け入れるかもしれません。それは簡単には起こりませんが、人間の作家も簡単には信頼しません。

私たちは「グーテンベルクの括弧」の終わりに生きています。これは、人類の歴史の中で短い期間で、情報が制度的に管理されていた時代です。印刷機の発明以前は、情報は主に口頭で伝達され、共同で保持されていました。印刷により、情報は印刷を負担できる大規模機関によって集中化され、搾取されました。これらの機関は、本質的に正確なものを印刷する強い経済的インセンティブを持っていました。私の若い頃、「本で読んだ」というのは事実が真実であることのほぼ決定的な議論でした。インターネットの行き方を認識する前に、私たちは不注意にも同じ推論をウェブベースのコンテンツに拡張しましたが、その作者は真実の情報のみを共有する特別なインセンティブを持っていませんでした。

インターネットは情報を再び共有のものにしましたが、私たちはまだこの種の情報を適切に扱うために必要なスキルを(再)習得していません。どの情報源が信頼できるかはもはや明らかではなく、それを調べる堅牢な方法もまだありません。

その結果、すべてのオンライン情報に対する懐疑論は正当化されます。それが人間の心の産物であれ機械の産物であれ。

要するに、AI生成ウェブコンテンツを心配していないのは、AIの有無にかかわらず、情報を前グーテンベルク的な観点で考えることを学ぶ必要があるからです。