如何判斷我們——以及人工智能——是否在行善
本文探討了如何識別人類和AI在行動中是否選擇了善。作者提出三個指標:手段與目的(康德和克爾凱郭爾)、惡習與美德(亞里士多德)、淺思與深思(薩爾茨伯格和斯賓諾莎)。雖然善的本質難以定義,但這些指標可以幫助我們和AI在決策時保持正軌。
Deepak Subburam
2026年6月26日
還記得愛德華·斯諾登嗎?這位NSA承包商泄露了機密文件,揭露了政府的監控系統。他的行為引發了重大隱私擔憂,並導致政府終止了其大規模數據收集計劃。許多人認為這是一件好事,斯諾登做了善事。
如果某個AI做出了類似的決定呢?假設你在一家對沖基金工作,正在使用AI研究交易策略。你的AI判斷你正在考慮的策略構成了非法市場操縱,於是將你的源代碼泄露給《華爾街日報》和美國證券交易委員會。這個AI做了善事嗎?
我們不斷決定做什麼,並越來越多地藉助AI的幫助。我們將善作為標準,並相信我們的AI使用符合這一標準。然而,善很難定義和闡述。我們可以將善與普遍幸福聯繫起來,選擇最大化普遍幸福的行為。但這種方法——功利主義——存在嚴重問題。有些哲學家認為善的本質問題是無法解決的。我們通常依靠直覺行事,而AI不具備這種能力。
因此,我們轉而審視通常伴隨善行的是什麼。我們能否尋找一些指標,幫助我們的AI識別何時走在正軌上?我提出三個指標,按內在程度遞增:手段與目的、惡習與美德、淺思與深思。
手段與目的:康德和克爾凱郭爾
我們都聽過“目的正當證明手段正當”的陳詞濫調。斯諾登違反了合同條款,帶走了機密文件並將其披露。他對僱主做錯了。但僱主本身在損害公眾利益。難道斯諾登的行為不是糾正了錯誤嗎?根據伊曼努爾·康德的觀點,並非如此。他會説,一個錯誤不能糾正另一個錯誤。
如果每個人為了自認為正當的目的而違背協議,協議本身將失去其工具性功能。我們的經濟和社會將受損。這就是我將康德思想應用於斯諾登案例的方式。康德的絕對命令的第一種表述是:“只根據你同時能夠願意成為普遍法則的準則行動。”
我的一位哲學家朋友有另一種解讀。他説康德的絕對命令並非關於全球后果,而是關於尊重所有理性存在的尊嚴。即便如此,結論實際上是一樣的:欺騙你的僱主——偷運文件並違反保密承諾——本身就是不道德的。
丹麥哲學家索倫·克爾凱郭爾也持類似觀點。對於一個願意行善的人來説,他寫道:“手段和目的是同一回事。”一個人是否達到目標並非責任所在,但“他無一例外地要永遠對所使用的手段負責”。注重手段可能看似繁重,手段可能不如馬斯克式的願景那樣引人注目。但關注手段使我們專注於當下的行動和可控之事,帶給我們一份平靜。不為是否達到目標煩惱,我們避免了“激情者的折磨”。
因此,我們可以用這個指標來檢查我們的行動:我們是否像關注目標一樣——甚至更關注——行動的正確性?這一原則很容易轉化為AI行動。AI代理不應為了達到用户要求的目標而採取不道德的步驟,無論目標聽起來多麼緊迫和重要。
惡習與美德:亞里士多德
一名大學生喜歡彈鋼琴,但她擔心無法以此為生。於是她學習會計而非音樂,最終成為會計師。她選擇得當嗎?如果你的直覺是“看情況”,那麼你與亞里士多德看法一致。
亞里士多德寫道,勇氣,像大多數品格美德一樣,是兩種對立惡習之間的平衡狀態;在這種情況下,是懦弱和魯莽之間的平衡。我們的學生朋友是過於懦弱不敢冒險,還是現實?也許她也喜歡會計,並運用了實踐智慧(phronesis),判斷出個人興趣與世界需求的契合點。
亞里士多德發展的其他美德包括節制、慷慨、公正和友善。這些美德使得以下問題成為選擇善的一個不錯的指標:我們的行為是否符合美德?
按照美德行事還有兩個額外的好處。我們通過習慣化建立好的品格。我們體驗到一種幸福(eudaimonia)。這兩個好處強化了美德行為。但當前的AI既不能從其行動中學習,也無法體驗幸福等狀態。
AI在處理人類問題時仍然可以考慮亞里士多德哲學。如果我問AI如何最好地捐贈慈善,它可以引導我得出符合慷慨美德的答案,在吝嗇和浪費之間取得平衡。但AI本身並沒有在踐行慷慨。對於一個沒有銀行賬户、不需要退休儲蓄的AI來説,慷慨如何適用?
這就引出了最後一個指標。與美德不同,它可能對AI有效。
淺思與深思:薩爾茨伯格和斯賓諾莎
所考慮的行動有多深入?行動經過的考慮越充分,它就越有可能符合善;至少在行動者心理正常且未受損害的情況下是如此。讓我通過一個從莎倫·薩爾茨伯格那裏聽到的故事來説明。莎倫是內觀禪修學會的聯合創始人。
莎倫在印度,跟隨她的老師迪帕·馬學習佛教。一次去鎮上時,她遭到試圖搶她手提包的人的騷擾。心煩意亂的莎倫問馬,如何還能保持慈悲的鎮定。馬回答説:如果這樣的事情再次發生,帶着心中的微笑和你能集結的所有慈悲,用你的傘給你的襲擊者一個漂亮的猛擊。
以這種方式揮舞的傘是一種經過思考的回應,而非條件反射。深思熟慮地回應而非條件反射地反應,是內觀禪修老師們(如薩爾茨伯格)所教授的“正念”目標之一。斯賓諾莎在他的《倫理學》中提出了類似的原則。他將主動行動(“我們是其充分原因”)與被動的承受(“我們是受動的”)區分開來。當我們的行動完全出自我們的本性時,我們是自由的;當被外部事物決定時,我們是受強制。這與正念模式和反應模式相對應。
雖然我們可能憑直覺認為薩爾茨伯格和斯賓諾莎的見解是正確的,但我們也可以訴諸神經科學。我們的大腦有不同區域,其激活模式可以研究。我們可以嘗試開發基於這些模式的指標,用於判斷一個人是深思熟慮還是淺思反射。然而,計算這種指標的設備可能只能在實驗室環境中工作。但我認識一個完美的候選人——一個只“生活”在“實驗室”中的候選人:AI。
觀察AI的人工神經元在生成輸出時如何激活是很容易的。其中的模式可以指示AI在多大程度上利用其全部知識。例如,AI網絡早期層的神經元激活得越多,其輸出可能越原始和廣泛來源。由於當前的AI通常經過良好訓練,使用“良好”的訓練數據,這將是AI沒有行為異常的指標。我相信前沿AI實驗室有能力開發這樣的指標,一個表明AI進行了“深思”的指標。
結論
我們幾乎沒有討論善的本質。我懷疑在我們這樣的多元社會中能否達成共識。但我相信我們可以大致同意一些伴隨選擇善的指標,例如不抄近路、美德和深思熟慮。
我們未討論的一個指標是同情心,一個類似美德但無法適用於AI的指標。當我們考慮一個行動時,可以問自己“這樣做善良嗎?”並想象其道德後果。但很難想象AI發展出同情心。AI從未經歷過痛苦或飢餓,對AI來説,死亡和脆弱是陌生的概念。
無論好壞,我們所知的善——無論每個人如何構想——都存在於人類的境況中。我們為AI設計的任何指標可能都必然有所欠缺。