AI News HubLIVE
站內改寫4 分鐘閱讀

提示詞並非作品本身:如何描述AI的貢獻

本文探討在生成式AI時代,我們需要更精確的語言來描述人類的貢獻。作者指出“AI生成”這一標籤過於模糊,無法區分不同程度的參與,如構思、指導、修改、驗證和認可。文章提出建立日常的“貢獻語法”,以便在對話中清晰表達實際參與程度。

來源Hacker News AI作者: petesergeant

在生成式AI時代,我們需要更好的詞彙來描述貢獻。辦公室裏、羣聊中、評論區裏,總有這樣一個場景:有人分享了一篇文字、一個設計、一段代碼,另一個人半開玩笑半帶敵意地問:“這是AI寫的嗎?”這個問題聽起來是在問作者身份,但實際上是在問貢獻:你是原創、指導、修改、驗證,還是僅僅是放手?這五個截然不同的答案,而二元選擇——“是”與“否”——缺乏必要的表達力。

關於作者身份和所有權的宏大新理論只會產生混亂、難懂的學術論文和紙上談兵。一個更實用的項目更小、更社交:我們需要日常語言——可以稱之為“貢獻語法”——來描述一件作品代表了怎樣的參與。當前語言的失敗首先是表達上的失敗,而非道德上的:早在有人撒謊之前,誠實的人就會無意中誤導他人,或保持沉默,因為他們缺乏描述自己貢獻的詞彙。法律、出版和學術界已經在忙着構建自己的詞彙,但我們其他人只需要能夠回答那個人在眯着眼睛看文檔並想知道它是如何被製作出來時真正想問的問題。

“AI生成的”是個糟糕的標籤。它既涵蓋了那些輸入“給我寫2000字關於供應鏈韌性”然後不讀就直接粘貼到LinkedIn上的人,也涵蓋了那些詳細描述架構、讓模型起草代碼、然後檢查每個函數、拒絕兩種方法、發現競爭條件並重寫錯誤處理的開發者。它涵蓋了一位花三個小時與模型對話、爭論、糾正、放棄的作家,其最終文本中沒有一個句子來自初稿。它也涵蓋了生成五十張圖像、挑選一張並用照片合成的藝術家。這個標籤缺乏解釋力,無法闡明實際發生的事情,因為它既涵蓋“幫我思考”也涵蓋“替我做思考”。

這些過程截然不同:投入的努力不同,認真程度不同,所有權不同,智力貢獻也不同——根本上説,行動的自主性也不同。一個將它們等同對待的標籤毫無用處,更糟糕的是,它通常帶有道德指控:“AI生成的”現在成了一個指責,因此人們要麼隱藏自己的過程,要麼過度坦白,而這都不能告訴我們關於作品的有用信息。

這並不是假設。研究科學作者身份的研究人員已經開始稱之為“透明度悖論”。一位用模型潤色了幾個句子的作者面臨着與用提示生成整個章節的作者相同的披露污名,因此作者要麼避免使用有用的工具,要麼保持沉默。證據表明,不披露主要源於不確定性,而非完全欺騙。在今天的詞彙中,即使是誠實的披露也既是揭示也是遮蔽。

打字從來不是好指標。我們之所以陷入困境,部分原因在於我們默默地將逐字逐句的生產視為貢獻的黃金標準:真正的作者是手指打出句子的人。但這個標準在AI之前就從未連貫過。編輯可以徹底改變手稿,使得出版的書可以説是合作成果,但封面上只有一個名字。舊大師們會讓學徒完成繁瑣的細節。沒人指望政治家真的自己寫回憶錄。

所以我們早就知道貢獻有多種形式:構思一個想法、指導其執行、選擇選項、完善、驗證、批准。但我們從未迫切需要日常語言來區分它們,因為每種形式都涉及努力——而努力可以代表一切。沒有努力的生成打破了這種代理關係。現在要描述的是自主性:不是誰的手指創作了句子,而是誰決定了句子應該是什麼。

稀缺的貢獻是判斷力。AI生成圖像中的六指手之所以尷尬,不是因為它是由機器製作的——我們都知道是機器製作的。尷尬是因為沒人費心去檢查。失敗不是生成失敗,而是判斷力和品味的失敗,而判斷力和品味正是人類應該提供的貢獻。

如果機器可以按需生成流暢的文本、合理的代碼和精美的圖像,那麼流暢、合理和精美就不再是人類努力的證據。“ChatGPT寫的”這個問題真正在摸索的是:這代表了你的多少判斷、專業知識和品味?這是你真正想要的意思嗎?批准AI起草代碼的開發者(希望如此)在聲稱:我讀了這些,我理解,我會在它凌晨三點出問題時負責。這就是為什麼“AI寫的”和“AI寫的但我驗證過”永遠不應該是同一個句子。後者包含了全部稀缺資源。

作品可能存在於迭代中。針對AI輔助寫作者有一個常見的詰難,Clayton Ramsey的“我寧願看提示”是其當前形式。論點在於LLM的輸出沒有添加任何提示中已經包含的東西,所以只需發送提示。想出提示本身就是工作,之後的一切都是贅餘:在ChatGPT窗口中按回車沒有貢獻。對於他描述的懶惰案例——一個提示,一次粘貼——確實如此。他的反對意見很好地針對了“我做了這個”,如果它意味着“我請求了這個,這就是我得到的”。但它從未觸及整個LLM增強生成類別,其中的貢獻在於“我雕刻了這”。

提示可以只是一個起點。當隨後付出努力時,努力存在於後續的序列:反對、糾正、拒絕、完善、接受。一個與模型進行了十輪交鋒的人留下了一系列決策,每個決策都對某些文本版本説了不,對其他説了是。把第一個提示發送給你幾乎不會告訴你關於最終產物的一切,就像發送給你作者的第一份大綱幾乎不會告訴你關於已發表文章的一切。迭代不是圍繞真正工作的開銷,它往往是真正的工作,我們還沒有一種有用的方式來描述這種工作。

認可並非無關緊要。還有一種容易忽視的貢獻:僅僅簽署同意。如果有人以自己名義發表文本並説“這代表我的觀點”,但大部分句子由模型生成,那麼稱之為橡皮圖章很誘人。但這並非無關緊要。並非每個人都有表達自己思想的詞彙,當別人找到它們時,認出它們本身就是一種表達行為。此外,認可是有實際後果的:認可者以自己的信譽做賭注,對錯誤承擔責任,並斷言內容與他們的意圖相符。人們準確認可機器起草的陳述的世界,與人們分享無人為之負責的文本的世界有本質區別。

認可顯然不是作者身份本身:簽名不會追溯性地產出作品。它也是最薄的貢獻主張——你可以簽署任何東西,無論你讀沒讀,與“我檢查了每一行”不同,它描述了過程,只有立場。僅憑它,從陌生人那裏,它幾乎不告訴我們任何事情。

但人們會撒謊。對以上一切顯而易見的反對意見是:這些更細緻的陳述都無法驗證。“我檢查了每一行”輸入起來和偽造起來一樣便宜。這是事實,但無關緊要。一項主張並不需要可驗證才有用。“我瀏覽了”是不可驗證但不可或缺的;“我讀了合同”和“我快完成了”也是如此。我們當然會繼續像以往那樣通過聲譽和後果來警醒謊言,即使現在我們失去了一個強大的努力信號。我們無法警醒的是誠實的人沒有合適詞彙——那些説“我寫了這個”卻感到像個騙子,或者“AI寫了這個”卻低估了一週工作的人。缺失詞彙的問題優先,而且只有詞彙能解決它。

走向貢獻語法。日常問題現在感覺是可處理的,而在需要更精細描述的地方,語法已經出現。學術出版正在湧現四級披露框架和名為GAIDeT、AID的分類法。開源項目已經開始要求拉取請求聲明代碼是完全AI生成但人工審查、大部分AI生成、還是大部分人工編寫,提交消息增加了“Assisted-By:”尾部。所有這些正式、機構化、有點笨拙——但都證明,在人們必須定期描述貢獻的地方,他們為它構建了詞彙。缺少的是會話層:用於Slack回覆而非合規表格的詞彙。

這些詞彙很便宜。我們可以開始簡單説出我們做了什麼:我指導了這個。我與模型一起起草並重寫了它。我檢查了每一行。我從多次嘗試中挑選了這個。我認可這個;我沒寫它。

這不是理論。只是區分——在作者身份、努力、判斷和認可之間——我們可以在日常對話中使用彼此。二元制“人類製作” vs “AI生成”是這種語法的初稿,在壓力下快速產出。而初稿應該被修改。

(文章末尾附有作者自己的貢獻聲明,説明文本的創作過程。)