AI News HubLIVE
站内改写5 分鐘閱讀

誰擁有克勞德編寫的代碼?

AI編碼工具生成的代碼可能不受版權保護、歸僱主所有,或被不可見的開源許可證污染。本文探討了相關法律問題,包括人類創作要求、僱傭合同權利以及開源許可證污染風險。

來源O'Reilly AI & ML Radar作者: Sena Evren

以下文章最初出現在Sena Evren的《法律層》通訊中,經作者許可在此轉載。

長話短説

像Claude Code、Cursor和Codex這樣的代理編碼工具生成的代碼可能不受版權保護、歸僱主所有,或被你看不到的開源許可證污染。其中一些是已確定的法律,一些是正在爭議的,本文將明確區分。如果你正在發佈AI輔助代碼並且還沒有考慮過這些問題,那麼本文就是為你準備的。

如果你本週發佈了代碼,其中一些很可能是由AI編寫的。誰合法擁有這些代碼的問題比大多數開發者認為的更不確定,答案取決於與代碼質量無關的三件事:人類是否做出了足夠的創造性決定來建立版權;你的僱傭合同是否已經將其分配給了你的僱主;模型是否從GPL許可的訓練數據中提取並悄悄污染了你的代碼庫。

2026年3月31日,Anthropic在一次常規軟件更新中意外發布了512,000行Claude Code源代碼,原因是缺少配置文件。黎明前,代碼庫被鏡像到GitHub上。早餐前,一名開發者使用AI工具將整個代碼庫用Python重寫,“claw-code”倉庫在一天內獲得了10萬顆GitHub星,創下有史以來最快紀錄。然後是DMCA下架通知,隨後出現了一個沒人能清晰回答的問題:如果按照Anthropic首席工程師自己的説法,Claude Code主要是由Claude本身編寫的,那麼Anthropic甚至擁有它嗎?你能對版權法可能不保護的代碼發出DMCA下架通知嗎?那個事件將所有關於AI生成代碼所有權的開放問題壓縮到一個新聞週期中。同樣的問題也適用於你的代碼庫。

沒人告訴你的版權規則

以下是法律基準,用直白的語言説:版權只保護人類創作的作品。美國版權局一直確認這一點,DC巡迴法院在Thaler案中維持了這一觀點。當最高法院在2026年3月拒絕審理Thaler上訴時,它並沒有認可下級法院的推理,也沒有在全國範圍內解決這個問題。拒絕調卷令意味着法院選擇不審理此案,僅此而已。它確實意味着DC巡迴法院的裁決成立,版權局的立場不變,沒有法院做出相反判決。在現行原則下,沒有有意義的人類著作權的AI主導生成作品不符合版權保護資格,即使沒有最終確定,這一立場也是穩定的。

Thaler實際決定的兩個重要限制。該案涉及一個完全沒有人類參與創作的繪畫。Thaler將AI系統列為唯一作者,並且沒有聲稱任何人類的創造性貢獻。該裁決並未直接涉及更難的AI輔助工作問題,即人類參與但參與程度有爭議的情況。Thaler涉及視覺藝術。還沒有法院將人類著作權原則具體應用於AI編碼工具的輸出。邏輯適用,但直接的先例還不存在。

這對你意味着什麼:Claude Code或Cursor生成而你未做有意義修改就接受的代碼可能任何人都不能享有版權。如果競爭對手複製它,你可能沒有法律追索權,因為代碼實際上處於公有領域。

決定你的代碼是否受保護的短語是“有意義的人類著作權”,版權局故意沒有用量化百分比或編輯次數來定義它,因為法院尋找的是人類做出真正創造性決定的證據:選擇架構、決定拒絕什麼、重構輸出以適應特定設計。向模型指定目標是不夠的。指導工作如何構建才是關鍵。在代理工作流程中,這種區別比聽起來更難建立。考慮一個典型的Claude Code會話:你寫一行提示:“為API構建一個速率限制模塊。”Claude Code規劃方法,生成五個文件,迭代三個版本。你審查輸出,運行測試,合併。你在該序列中的貢獻是你的架構意圖和最終批准。這在法庭上是否構成有意義的人類著作權是一個尚未解決且沒有最終法院裁決的問題。誠實的答案是:對於你大幅重定向的模塊可能是肯定的,對於你原樣接受的代碼可能是否定的,介於兩者之間的則不明確。

中間地帶目前正在積極訴訟中。在Allen v. Perlmutter案中,藝術家Jason Allen正在挑戰版權局拒絕註冊他使用超過600個詳細提示和後續Photoshop編輯創作的作品。版權局承認Photoshop編輯是人工創作的,但仍拒絕註冊AI生成的底層元素。該案尚未判決,無論判決結果如何,都將是關於多少人類參與才足夠的最接近的裁決。

關於部分保護的最接近的先例是Zarya of the Dawn,一部圖像小説,版權局為人工創作的文本授予註冊,但拒絕了Midjourney生成圖像的註冊。該決定確立了一個開發者現在可以使用的實際原則:AI輔助代碼庫中人類創作的元素可能可以單獨保護,即使生成的代碼本身不可保護。你的架構文檔、提交信息中記錄的設計決策、你的ADR、顯示有意識重定向的提示日誌——這些可能作為人類創作的表達而受到保護,即使它們產生的代碼不受到保護。保護你能保護的東西始於記錄你實際做了什麼。

你的僱主可能已經擁有的東西

在你考慮代碼是否受版權保護之前,還有一個更直接的問題:即使受保護,它真的屬於你嗎?你的僱傭合同幾乎肯定説明你在工作中構建的任何東西都屬於你的僱主。這一原則在版權法中有一個名稱:僱傭作品原則。根據該原則,僱員在僱傭範圍內創作的任何代碼都由僱主擁有,僱主被視為法律作者,無論代碼是手寫、由Claude Code生成,還是兩者結合。在工作時間、工作項目、工作機器上使用AI編碼工具不會改變誰擁有結果。大多數僱傭合同比該原則的默認範圍走得更遠。在你的合同中尋找名為“知識產權”、“IP分配”或“工作產品”的部分。打開合同,搜索這些術語,並閲讀該部分。一個包含以下任何內容的條款幾乎肯定涵蓋你的AI輔助代碼:“使用公司設備或資源創建的任何工作產品”、“在僱傭期間作出的任何發明或開發”、“藉助公司許可工具創建的任何軟件”。第三個值得注意。如果你的僱主為團隊許可了Claude Code、Cursor或Copilot,而你使用相同的工具構建一個副項目,廣泛的IP分配條款可能讓僱主對該項目擁有主張,即使你是在自己的時間構建的。

舊金山的一位高級開發人員今年早些時候描述了完全這種情況。他為工作項目使用Claude Code,也為晚上和週末構建的個人健身跟蹤應用使用。他的公司更新了IP政策,聲稱他使用AI輔助構建的所有東西(包括個人應用)都屬於公司,理由是Claude在IDE中訪問了開放的工作文件,因此任何AI輸出都是公司IP的衍生作品。這是這種情況能走多遠的明顯例子。他公司的論點基於一個短語:AI工具“上下文感知”了公司的代碼庫。該論據在法律上站不住腳,因為IDE中的上下文可見性不會使AI輸出成為附近打開文件的衍生作品,Claude能看到什麼和產生什麼之間的連接是概率性的模式補全,而不是複製。但該論點説明了僱主開始主張什麼。如果條款足夠寬泛,無論AI實際做了什麼,它都有表面有效性。實際規則:如果你在構建一些副業,使用個人賬户、個人機器和自己付費的工具。完全將僱主的許可工具排除在該工作流程之外。

開源污染問題

即使你擁有AI生成的代碼,你可能已經用你看不到的開源許可證污染了它。AI編碼工具訓練於大量公共代碼,包括GPL、LGPL和其他有傳染性許可證的代碼。有傳染性的許可證帶有特定的義務,隨代碼傳播:如果你分發GPL許可代碼的衍生產品,你必須以相同許可證發佈你自己的源代碼。即使你不知道你合併的代碼是GPL許可的,這也適用。“我不知道”不是違反有傳染性許可證的辯護。

當AI工具從其訓練數據中複製了GPL許可代碼的大量逐字部分,你在商業產品中發佈該代碼而不公開源代碼時,你可能就造成了違反有傳染性許可證的情況,而從未接觸過原始倉庫。侵權的法律標準是大量的逐字複製,而不是功能相似或相似,這種區別很重要:AI工具生成與GPL代碼功能相似的代碼不同於AI工具逐字複製GPL代碼。風險在於逐字複製的一端,問題是你無法知道你的代碼庫在哪一邊,除非運行掃描。

2026年初的chardet社區爭端使這一點具體化。這不是一個已提起的訴訟,而是開源社區內的一場公開爭端,提出了問題但沒有法律解決。一名開發者使用Claude重寫了chardet(一個Python字符編碼庫),並以MIT許可證重新發布,聲稱AI重寫是“潔淨室”實現,不包含原始LGPL許可證。社區爭論的法律問題是:如果Claude在LGPL許可的代碼庫上訓練,並且其輸出複製了該代碼的大量逐字部分,輸出能否被視為無許可證?chardet爭端沒有乾淨解決,也沒有法院對此問題做出明確裁決。已確定的是,逐字複製GPL代碼違反許可證,無論它是如何產生的。未確定的是,複製訓練數據模式的AI輸出是否算作逐字複製。在併購中為公司提供建議的律師的工作假設是可能算,這一假設現在作為標準條件出現在收購盡職調查中。

截至2026年4月仍在第九巡迴法院審理的Doe v GitHub訴訟,正在詢問GitHub Copilot是否在違反版權法和DMCA第1202條的情況下無署名複製許可代碼。地區法院駁回了大多數主張,但上訴仍在進行。無論結果如何,該訴訟已經改變了行業行為:GitHub Copilot添加了重複檢測過濾器,收購盡職調查現在常規包括AI代碼庫許可證掃描。

如何處理這一切

四項具體行動,都不需要律師。

  1. 對AI輔助代碼庫進行許可證掃描。

做得好的工具:

FOSSA——最全面,廣泛使用

[因AI成本控制而截斷]