AI News HubLIVE
站内改写5 分钟阅读

谁拥有克劳德编写的代码?

AI编码工具生成的代码可能不受版权保护、归雇主所有,或被不可见的开源许可证污染。本文探讨了相关法律问题,包括人类创作要求、雇佣合同权利以及开源许可证污染风险。

来源O'Reilly AI & ML Radar作者: Sena Evren

以下文章最初出现在Sena Evren的《法律层》通讯中,经作者许可在此转载。

长话短说

像Claude Code、Cursor和Codex这样的代理编码工具生成的代码可能不受版权保护、归雇主所有,或被你看不到的开源许可证污染。其中一些是已确定的法律,一些是正在争议的,本文将明确区分。如果你正在发布AI辅助代码并且还没有考虑过这些问题,那么本文就是为你准备的。

如果你本周发布了代码,其中一些很可能是由AI编写的。谁合法拥有这些代码的问题比大多数开发者认为的更不确定,答案取决于与代码质量无关的三件事:人类是否做出了足够的创造性决定来建立版权;你的雇佣合同是否已经将其分配给了你的雇主;模型是否从GPL许可的训练数据中提取并悄悄污染了你的代码库。

2026年3月31日,Anthropic在一次常规软件更新中意外发布了512,000行Claude Code源代码,原因是缺少配置文件。黎明前,代码库被镜像到GitHub上。早餐前,一名开发者使用AI工具将整个代码库用Python重写,“claw-code”仓库在一天内获得了10万颗GitHub星,创下有史以来最快纪录。然后是DMCA下架通知,随后出现了一个没人能清晰回答的问题:如果按照Anthropic首席工程师自己的说法,Claude Code主要是由Claude本身编写的,那么Anthropic甚至拥有它吗?你能对版权法可能不保护的代码发出DMCA下架通知吗?那个事件将所有关于AI生成代码所有权的开放问题压缩到一个新闻周期中。同样的问题也适用于你的代码库。

没人告诉你的版权规则

以下是法律基准,用直白的语言说:版权只保护人类创作的作品。美国版权局一直确认这一点,DC巡回法院在Thaler案中维持了这一观点。当最高法院在2026年3月拒绝审理Thaler上诉时,它并没有认可下级法院的推理,也没有在全国范围内解决这个问题。拒绝调卷令意味着法院选择不审理此案,仅此而已。它确实意味着DC巡回法院的裁决成立,版权局的立场不变,没有法院做出相反判决。在现行原则下,没有有意义的人类著作权的AI主导生成作品不符合版权保护资格,即使没有最终确定,这一立场也是稳定的。

Thaler实际决定的两个重要限制。该案涉及一个完全没有人类参与创作的绘画。Thaler将AI系统列为唯一作者,并且没有声称任何人类的创造性贡献。该裁决并未直接涉及更难的AI辅助工作问题,即人类参与但参与程度有争议的情况。Thaler涉及视觉艺术。还没有法院将人类著作权原则具体应用于AI编码工具的输出。逻辑适用,但直接的先例还不存在。

这对你意味着什么:Claude Code或Cursor生成而你未做有意义修改就接受的代码可能任何人都不能享有版权。如果竞争对手复制它,你可能没有法律追索权,因为代码实际上处于公有领域。

决定你的代码是否受保护的短语是“有意义的人类著作权”,版权局故意没有用量化百分比或编辑次数来定义它,因为法院寻找的是人类做出真正创造性决定的证据:选择架构、决定拒绝什么、重构输出以适应特定设计。向模型指定目标是不够的。指导工作如何构建才是关键。在代理工作流程中,这种区别比听起来更难建立。考虑一个典型的Claude Code会话:你写一行提示:“为API构建一个速率限制模块。”Claude Code规划方法,生成五个文件,迭代三个版本。你审查输出,运行测试,合并。你在该序列中的贡献是你的架构意图和最终批准。这在法庭上是否构成有意义的人类著作权是一个尚未解决且没有最终法院裁决的问题。诚实的答案是:对于你大幅重定向的模块可能是肯定的,对于你原样接受的代码可能是否定的,介于两者之间的则不明确。

中间地带目前正在积极诉讼中。在Allen v. Perlmutter案中,艺术家Jason Allen正在挑战版权局拒绝注册他使用超过600个详细提示和后续Photoshop编辑创作的作品。版权局承认Photoshop编辑是人工创作的,但仍拒绝注册AI生成的底层元素。该案尚未判决,无论判决结果如何,都将是关于多少人类参与才足够的最接近的裁决。

关于部分保护的最接近的先例是Zarya of the Dawn,一部图像小说,版权局为人工创作的文本授予注册,但拒绝了Midjourney生成图像的注册。该决定确立了一个开发者现在可以使用的实际原则:AI辅助代码库中人类创作的元素可能可以单独保护,即使生成的代码本身不可保护。你的架构文档、提交信息中记录的设计决策、你的ADR、显示有意识重定向的提示日志——这些可能作为人类创作的表达而受到保护,即使它们产生的代码不受到保护。保护你能保护的东西始于记录你实际做了什么。

你的雇主可能已经拥有的东西

在你考虑代码是否受版权保护之前,还有一个更直接的问题:即使受保护,它真的属于你吗?你的雇佣合同几乎肯定说明你在工作中构建的任何东西都属于你的雇主。这一原则在版权法中有一个名称:雇佣作品原则。根据该原则,雇员在雇佣范围内创作的任何代码都由雇主拥有,雇主被视为法律作者,无论代码是手写、由Claude Code生成,还是两者结合。在工作时间、工作项目、工作机器上使用AI编码工具不会改变谁拥有结果。大多数雇佣合同比该原则的默认范围走得更远。在你的合同中寻找名为“知识产权”、“IP分配”或“工作产品”的部分。打开合同,搜索这些术语,并阅读该部分。一个包含以下任何内容的条款几乎肯定涵盖你的AI辅助代码:“使用公司设备或资源创建的任何工作产品”、“在雇佣期间作出的任何发明或开发”、“借助公司许可工具创建的任何软件”。第三个值得注意。如果你的雇主为团队许可了Claude Code、Cursor或Copilot,而你使用相同的工具构建一个副项目,广泛的IP分配条款可能让雇主对该项目拥有主张,即使你是在自己的时间构建的。

旧金山的一位高级开发人员今年早些时候描述了完全这种情况。他为工作项目使用Claude Code,也为晚上和周末构建的个人健身跟踪应用使用。他的公司更新了IP政策,声称他使用AI辅助构建的所有东西(包括个人应用)都属于公司,理由是Claude在IDE中访问了开放的工作文件,因此任何AI输出都是公司IP的衍生作品。这是这种情况能走多远的明显例子。他公司的论点基于一个短语:AI工具“上下文感知”了公司的代码库。该论据在法律上站不住脚,因为IDE中的上下文可见性不会使AI输出成为附近打开文件的衍生作品,Claude能看到什么和产生什么之间的连接是概率性的模式补全,而不是复制。但该论点说明了雇主开始主张什么。如果条款足够宽泛,无论AI实际做了什么,它都有表面有效性。实际规则:如果你在构建一些副业,使用个人账户、个人机器和自己付费的工具。完全将雇主的许可工具排除在该工作流程之外。

开源污染问题

即使你拥有AI生成的代码,你可能已经用你看不到的开源许可证污染了它。AI编码工具训练于大量公共代码,包括GPL、LGPL和其他有传染性许可证的代码。有传染性的许可证带有特定的义务,随代码传播:如果你分发GPL许可代码的衍生产品,你必须以相同许可证发布你自己的源代码。即使你不知道你合并的代码是GPL许可的,这也适用。“我不知道”不是违反有传染性许可证的辩护。

当AI工具从其训练数据中复制了GPL许可代码的大量逐字部分,你在商业产品中发布该代码而不公开源代码时,你可能就造成了违反有传染性许可证的情况,而从未接触过原始仓库。侵权的法律标准是大量的逐字复制,而不是功能相似或相似,这种区别很重要:AI工具生成与GPL代码功能相似的代码不同于AI工具逐字复制GPL代码。风险在于逐字复制的一端,问题是你无法知道你的代码库在哪一边,除非运行扫描。

2026年初的chardet社区争端使这一点具体化。这不是一个已提起的诉讼,而是开源社区内的一场公开争端,提出了问题但没有法律解决。一名开发者使用Claude重写了chardet(一个Python字符编码库),并以MIT许可证重新发布,声称AI重写是“洁净室”实现,不包含原始LGPL许可证。社区争论的法律问题是:如果Claude在LGPL许可的代码库上训练,并且其输出复制了该代码的大量逐字部分,输出能否被视为无许可证?chardet争端没有干净解决,也没有法院对此问题做出明确裁决。已确定的是,逐字复制GPL代码违反许可证,无论它是如何产生的。未确定的是,复制训练数据模式的AI输出是否算作逐字复制。在并购中为公司提供建议的律师的工作假设是可能算,这一假设现在作为标准条件出现在收购尽职调查中。

截至2026年4月仍在第九巡回法院审理的Doe v GitHub诉讼,正在询问GitHub Copilot是否在违反版权法和DMCA第1202条的情况下无署名复制许可代码。地区法院驳回了大多数主张,但上诉仍在进行。无论结果如何,该诉讼已经改变了行业行为:GitHub Copilot添加了重复检测过滤器,收购尽职调查现在常规包括AI代码库许可证扫描。

如何处理这一切

四项具体行动,都不需要律师。

  1. 对AI辅助代码库进行许可证扫描。

做得好的工具:

FOSSA——最全面,广泛使用

[因AI成本控制而截断]