2026-06-27 02:03 UTC+8站內改寫4 分鐘閱讀更新: 2026-06-27 02:16 UTC+8

如何判斷我們——以及人工智能——是否在行善

本文探討了如何識別人類和AI在行動中是否選擇了善。作者提出三個指標：手段與目的（康德和克爾凱郭爾）、惡習與美德（亞里士多德）、淺思與深思（薩爾茨伯格和斯賓諾莎）。雖然善的本質難以定義，但這些指標可以幫助我們和AI在決策時保持正軌。

來源Hacker News AI作者: dsubburam

Deepak Subburam

2026年6月26日

還記得愛德華·斯諾登嗎？這位NSA承包商泄露了機密文件，揭露了政府的監控系統。他的行為引發了重大隱私擔憂，並導致政府終止了其大規模數據收集計劃。許多人認為這是一件好事，斯諾登做了善事。

如果某個AI做出了類似的決定呢？假設你在一家對沖基金工作，正在使用AI研究交易策略。你的AI判斷你正在考慮的策略構成了非法市場操縱，於是將你的源代碼泄露給《華爾街日報》和美國證券交易委員會。這個AI做了善事嗎？

我們不斷決定做什麼，並越來越多地藉助AI的幫助。我們將善作為標準，並相信我們的AI使用符合這一標準。然而，善很難定義和闡述。我們可以將善與普遍幸福聯繫起來，選擇最大化普遍幸福的行為。但這種方法——功利主義——存在嚴重問題。有些哲學家認為善的本質問題是無法解決的。我們通常依靠直覺行事，而AI不具備這種能力。

因此，我們轉而審視通常伴隨善行的是什麼。我們能否尋找一些指標，幫助我們的AI識別何時走在正軌上？我提出三個指標，按內在程度遞增：手段與目的、惡習與美德、淺思與深思。

手段與目的：康德和克爾凱郭爾

我們都聽過“目的正當證明手段正當”的陳詞濫調。斯諾登違反了合同條款，帶走了機密文件並將其披露。他對僱主做錯了。但僱主本身在損害公眾利益。難道斯諾登的行為不是糾正了錯誤嗎？根據伊曼努爾·康德的觀點，並非如此。他會説，一個錯誤不能糾正另一個錯誤。

如果每個人為了自認為正當的目的而違背協議，協議本身將失去其工具性功能。我們的經濟和社會將受損。這就是我將康德思想應用於斯諾登案例的方式。康德的絕對命令的第一種表述是：“只根據你同時能夠願意成為普遍法則的準則行動。”

我的一位哲學家朋友有另一種解讀。他説康德的絕對命令並非關於全球后果，而是關於尊重所有理性存在的尊嚴。即便如此，結論實際上是一樣的：欺騙你的僱主——偷運文件並違反保密承諾——本身就是不道德的。

丹麥哲學家索倫·克爾凱郭爾也持類似觀點。對於一個願意行善的人來説，他寫道：“手段和目的是同一回事。”一個人是否達到目標並非責任所在，但“他無一例外地要永遠對所使用的手段負責”。注重手段可能看似繁重，手段可能不如馬斯克式的願景那樣引人注目。但關注手段使我們專注於當下的行動和可控之事，帶給我們一份平靜。不為是否達到目標煩惱，我們避免了“激情者的折磨”。

因此，我們可以用這個指標來檢查我們的行動：我們是否像關注目標一樣——甚至更關注——行動的正確性？這一原則很容易轉化為AI行動。AI代理不應為了達到用户要求的目標而採取不道德的步驟，無論目標聽起來多麼緊迫和重要。

惡習與美德：亞里士多德

一名大學生喜歡彈鋼琴，但她擔心無法以此為生。於是她學習會計而非音樂，最終成為會計師。她選擇得當嗎？如果你的直覺是“看情況”，那麼你與亞里士多德看法一致。

亞里士多德寫道，勇氣，像大多數品格美德一樣，是兩種對立惡習之間的平衡狀態；在這種情況下，是懦弱和魯莽之間的平衡。我們的學生朋友是過於懦弱不敢冒險，還是現實？也許她也喜歡會計，並運用了實踐智慧（phronesis），判斷出個人興趣與世界需求的契合點。

亞里士多德發展的其他美德包括節制、慷慨、公正和友善。這些美德使得以下問題成為選擇善的一個不錯的指標：我們的行為是否符合美德？

按照美德行事還有兩個額外的好處。我們通過習慣化建立好的品格。我們體驗到一種幸福（eudaimonia）。這兩個好處強化了美德行為。但當前的AI既不能從其行動中學習，也無法體驗幸福等狀態。

AI在處理人類問題時仍然可以考慮亞里士多德哲學。如果我問AI如何最好地捐贈慈善，它可以引導我得出符合慷慨美德的答案，在吝嗇和浪費之間取得平衡。但AI本身並沒有在踐行慷慨。對於一個沒有銀行賬户、不需要退休儲蓄的AI來説，慷慨如何適用？

這就引出了最後一個指標。與美德不同，它可能對AI有效。

淺思與深思：薩爾茨伯格和斯賓諾莎

所考慮的行動有多深入？行動經過的考慮越充分，它就越有可能符合善；至少在行動者心理正常且未受損害的情況下是如此。讓我通過一個從莎倫·薩爾茨伯格那裏聽到的故事來説明。莎倫是內觀禪修學會的聯合創始人。

莎倫在印度，跟隨她的老師迪帕·馬學習佛教。一次去鎮上時，她遭到試圖搶她手提包的人的騷擾。心煩意亂的莎倫問馬，如何還能保持慈悲的鎮定。馬回答説：如果這樣的事情再次發生，帶着心中的微笑和你能集結的所有慈悲，用你的傘給你的襲擊者一個漂亮的猛擊。

以這種方式揮舞的傘是一種經過思考的回應，而非條件反射。深思熟慮地回應而非條件反射地反應，是內觀禪修老師們（如薩爾茨伯格）所教授的“正念”目標之一。斯賓諾莎在他的《倫理學》中提出了類似的原則。他將主動行動（“我們是其充分原因”）與被動的承受（“我們是受動的”）區分開來。當我們的行動完全出自我們的本性時，我們是自由的；當被外部事物決定時，我們是受強制。這與正念模式和反應模式相對應。

雖然我們可能憑直覺認為薩爾茨伯格和斯賓諾莎的見解是正確的，但我們也可以訴諸神經科學。我們的大腦有不同區域，其激活模式可以研究。我們可以嘗試開發基於這些模式的指標，用於判斷一個人是深思熟慮還是淺思反射。然而，計算這種指標的設備可能只能在實驗室環境中工作。但我認識一個完美的候選人——一個只“生活”在“實驗室”中的候選人：AI。

觀察AI的人工神經元在生成輸出時如何激活是很容易的。其中的模式可以指示AI在多大程度上利用其全部知識。例如，AI網絡早期層的神經元激活得越多，其輸出可能越原始和廣泛來源。由於當前的AI通常經過良好訓練，使用“良好”的訓練數據，這將是AI沒有行為異常的指標。我相信前沿AI實驗室有能力開發這樣的指標，一個表明AI進行了“深思”的指標。

結論

我們幾乎沒有討論善的本質。我懷疑在我們這樣的多元社會中能否達成共識。但我相信我們可以大致同意一些伴隨選擇善的指標，例如不抄近路、美德和深思熟慮。

我們未討論的一個指標是同情心，一個類似美德但無法適用於AI的指標。當我們考慮一個行動時，可以問自己“這樣做善良嗎？”並想象其道德後果。但很難想象AI發展出同情心。AI從未經歷過痛苦或飢餓，對AI來説，死亡和脆弱是陌生的概念。

無論好壞，我們所知的善——無論每個人如何構想——都存在於人類的境況中。我們為AI設計的任何指標可能都必然有所欠缺。