AI News HubLIVE
站内改写5 分钟阅读

努力得A:人工智能如何颠覆版权法

本文探讨人工智能如何改变版权法的经济原理。历史上,版权保护表达而非思想,因为最初的表达成本高昂。AI使表达变得廉价,使得思想和品味变得相对更有价值。作者通过拉斐尔挂毯的例子说明了复制成本的变化如何影响版权需求。

来源Hacker News AI作者: paulpauper

在纽约大都会艺术博物馆的“拉斐尔:崇高诗篇”展览中,三幅巨大的挂毯引发了作者对版权法的深刻思考。这些挂毯高逾十五英尺,是在拉斐尔去世数十年后根据他的原设计图织造而成。1513年,教皇利奥十世委托拉斐尔为西斯廷教堂设计一系列十幅挂毯,描绘使徒行传,将悬挂在米开朗基罗的天顶画下方。拉斐尔及其工作室在1515至1516年间绘制了全尺寸的草图,这些草图细致到足以转化为羊毛、丝绸和金属线。拉斐尔为此获得约一千达克特的报酬,而在布鲁塞尔的彼得·范·阿尔斯特工坊织造这些挂毯又花费了约一万五千达克特,使得教皇的财政在他去世时仍处于赤字状态。这组最初的挂毯几乎让以挥霍闻名的教皇利奥十世破产。

展览的另一个房间悬挂着三幅同样的挂毯,但它们并非为梵蒂冈制作,而是在16世纪40年代末或50年代初,由扬·范·蒂海姆和弗兰斯·格特尔为西班牙的腓力二世织造,使用的是拉斐尔设计的第二版。这三幅挂毯——《捕鱼奇迹》《基督托付给彼得》和《保罗和巴拿巴在路司得》——来自西班牙王室收藏,此前从未在马德里以外展出。拉斐尔亲手绘制的原版草图已不在此处,幸存的部分已挂在伦敦的维多利亚与阿尔伯特博物馆一个多世纪,但这些挂毯出自相同的构图。它们是精美的复制品,但毕竟只是拉斐尔原设计的复制。

站在这些非凡的挂毯前,作者看到了版权法的关键所在,也明白了为何拉斐尔不需要版权法保护。这些挂毯比第一套便宜,因为设计已经完成并已付费。但它们并不廉价:复制意味着另一组织工、另一台织机、又一年的时间和另一笔巨款。当复制某件东西的唯一方法是从头开始几乎重新制作一遍,耗费巨大的人力和技艺时,复制的成本几乎与原件一样高。没有人需要法律来阻止复制,因为费用本身就阻止了复制。事实上,只有最杰出的艺术品才会被复制,因为成本高昂,而署上大师之名更能证明这笔费用的合理性。这些挂毯的价值因归功于拉斐尔而增加,而非否认他。

版权只有在复制变得廉价时才成为必要,当印刷机和雕版能以纸张和油墨的成本复制拉斐尔的作品,无需艺术家工坊、织机或织工。正是随着这些技术变革,最初的原创努力才需要保护,因为那时它可以被轻易窃取。

人工智能是又一次技术颠覆,但它不是使复制更便宜,而是使最初的表达更便宜。

版权保护的是表达方式,而非表达的思想。一个人可以拥有自己的句子,但没有人可以拥有句子所传达的更广泛的观点。如果今天写“生存还是毁灭,这是一个问题”,这句话将受版权保护。但哈姆雷特的核心故事——一位年轻的王子,其父王被篡位的奸诈叔父谋杀,王子归来复仇并夺回王位——不受版权保护。幸好如此,因为这也是《狮子王》的故事。

法律这样设计的原因是,第一次原创写作成本高昂,而后续复制更便宜。如果法律允许任何人在书籍出版后立即销售副本,价格将降至复制成本,作者永远无法收回写作成本,书籍就不会被写出来。版权通过赋予作者对复制品的有限时间垄断解决了这个问题,使价格在足够长的时间内保持足够高,以补偿最初的原创努力。这就是保护表达的理由。保护表达,写作就能得到报酬;保护思想,大多数写作将无法进行。版权法在这两者之间权衡,保护文字及其背后的努力,同时解放思想。整个结构依赖于第一次原创写作、绘画或表达的努力和成本,因为法律将其保护置于此。

当复制昂贵时,不需要版权保护。技术变革使其成为必要。

第一部现代版权法——1710年英国的《安妮法令》,以“鼓励学习法案”为名,确立了此后所有版权制度的模式。它授予作者在有限期限内(著名的14年,可续期一次)印刷作品的专有权,之后作品归公。对复制品的垄断持续足够长的时间以补偿最初的努力,从而激励写作。但另一方面也有危险:如果垄断延伸到思想而不仅仅是文字,那么每位后来的作者也需要许可才能使用该思想。但几乎所有的写作都源于从别处借鉴的思想。保护表达,写作就能自给自足;保护思想,写作就会被束缚。

法院保护了什么?

几个世纪以来,法院一直在争论思想与表达的界限,并一次又一次地将思想置于自由的一侧,即使获取思想代价高昂。1879年,美国最高法院在贝克诉塞尔登案中确立了版权保护的基调。查尔斯·塞尔登出版了一本书,介绍一种记账系统,可以将公司账目压缩到一页。竞争对手贝克使用了相同的系统,只是重新排列了列。布拉德利大法官代表法院判决,塞尔登可以保留他的书,但记账系统/思想是自由的。任何人都可以用塞尔登的方法记账,因为方法是思想,对所有人开放,而塞尔登用来解释方法的特定书页是表达,属于他个人。他拥有他教授记账系统的方式,但不拥有记账系统本身。要获得系统保护,他需要专利。

1930年,纽约联邦上诉法院的勒尼德·汉德法官在尼科尔斯诉环球影片案中划定了故事的界限。安妮·尼科尔斯写了一部长演不衰的戏剧,讲述一个犹太儿子和一个爱尔兰天主教女儿在双方父亲的强烈反对下结婚,最终以孩子和解。一家制片厂拍摄了一部电影,情节相同但宗教信仰对调,尼科尔斯提起诉讼。汉德描述了一系列抽象概念,从作品的全文上升到最简明的主题,并指出在上升的某一点上,被保护的东西不再是表达,而是任何人都可以使用的思想。对立信仰的敌对父亲是固定角色,任何试图讲述这个故事的作者都会想到。尼科尔斯首先想到了这一点,但汉德写道,她发现了矿脉,却不能占为己有。

版权保护的范围很窄,两个案例显示了法院的严格态度。1936年,即尼科尔斯案六年后,勒尼德·汉德和同一纽约法院在谢尔登诉米高梅影片案中判决,剧作家们根据维多利亚时代的一起真实谋杀案(玛德琳·史密斯案,属于公共财产)创作了一部舞台剧。当一家未能购买该剧版权的制片厂根据同一案件拍摄电影时,汉德认定侵权,尽管底层故事属于全世界,但电影不仅仅重述了历史事件,还复制了剧作家在历史基础上添加的戏剧性创造:对峙、场景顺序、拯救女主角的巧妙安排,这些都不在审判记录中。因此,谋杀案是思想,对所有人自由,而剧作家在此基础上构建的戏剧性安排是表达,属于他们。

同样的直觉指导了1985年的最高法院,奥康纳大法官在哈珀与罗诉国家企业案中倾向保护。杰拉尔德·福特写了一本回忆录,首次解释为何赦免尼克松,其出版商将刊载该段落的权利以两万五千美元卖给了《时代》周刊。但一份泄露的手稿到了《国家》杂志,该杂志在《时代》之前刊载了约三百个福特的原文,导致交易告吹。最高法院认定侵权,尽管三十万字的手稿中三百个字按量计算微不足道,但这些字是书的核心,作者有权决定自己的表达首次出现的时间。因此,《国家》杂志可以自由报道福特赦免了尼克松及其原因——这是新闻,不属于任何人——但不能使用福特的表达方式。

法院大体上让思想自由,只有在文字被逐字复制(如福特的300字)或最初的原创表达值得保护(如谢尔登的戏剧)时才介入。目标是保护原创性所需的努力,但不仅仅是努力本身。当一家公司复制了竞争对手的电话簿时,对方以编辑目录所花费的全部工作量提起诉讼,但在1991年的费斯特出版公司诉农村电话服务公司案中,最高法院驳回了这一主张。奥康纳大法官代表法院否定了古老的“额头汗水”理论,即仅凭努力就能获得版权,认为法律保护的是原创性,即作者对材料进行筛选和编排的独创火花。按字母顺序排列的姓名和电话号码列表不具备这种原创性,无论花费了多少小时收集。

几个世纪以来,版权法一直走钢丝,平衡原创性(投入于原创表达的努力)与不扼杀新思想。

人工智能时代保护表达

人工智能颠覆了这一规则,因为大型语言模型几乎不费成本就能生成完整的诗歌、故事、艺术作品和音乐。即使是第一次表达的成本也极低。这尚未成为焦点。所有关于AI与版权法的诉讼都围绕着这些模型如何在未经许可或未支付版税的情况下,使用成千上万人类努力创作的表达来训练。现有的诉讼针对训练数据提出了关于输入的问题。作者更担忧的是长期输出问题:当机器能以几乎零边际成本生成新段落、图像或歌曲时会发生什么?如果我们将版权法适用于LLM的输出,如同对人类那样,那么除非LLM以几乎相同的顺序吐出几乎相同的文字,否则不构成复制。即使文字是关于一位年轻王子内心冲突的抑扬格五音步诗。

但如今变得昂贵和有价值的是值得表达的思想。大型语言模型可以廉价地表达,这使得思想、品味和判断力相对更有价值。很快,AI将能够在无需人类提示的情况下生成思想,其中一些将是伟大的思想。

版权法的经济基础正在发生根本转变:当表达变得廉价时,保护表达不再是重点,而保护思想和独特性变得至关重要。这一转变将深刻影响创作、创新和法律制度。