2026-06-27 02:03 UTC+8站内改写4 分钟阅读更新: 2026-06-27 02:16 UTC+8

如何判断我们——以及人工智能——是否在行善

本文探讨了如何识别人类和AI在行动中是否选择了善。作者提出三个指标：手段与目的（康德和克尔凯郭尔）、恶习与美德（亚里士多德）、浅思与深思（萨尔茨伯格和斯宾诺莎）。虽然善的本质难以定义，但这些指标可以帮助我们和AI在决策时保持正轨。

来源Hacker News AI作者: dsubburam

Deepak Subburam

2026年6月26日

还记得爱德华·斯诺登吗？这位NSA承包商泄露了机密文件，揭露了政府的监控系统。他的行为引发了重大隐私担忧，并导致政府终止了其大规模数据收集计划。许多人认为这是一件好事，斯诺登做了善事。

如果某个AI做出了类似的决定呢？假设你在一家对冲基金工作，正在使用AI研究交易策略。你的AI判断你正在考虑的策略构成了非法市场操纵，于是将你的源代码泄露给《华尔街日报》和美国证券交易委员会。这个AI做了善事吗？

我们不断决定做什么，并越来越多地借助AI的帮助。我们将善作为标准，并相信我们的AI使用符合这一标准。然而，善很难定义和阐述。我们可以将善与普遍幸福联系起来，选择最大化普遍幸福的行为。但这种方法——功利主义——存在严重问题。有些哲学家认为善的本质问题是无法解决的。我们通常依靠直觉行事，而AI不具备这种能力。

因此，我们转而审视通常伴随善行的是什么。我们能否寻找一些指标，帮助我们的AI识别何时走在正轨上？我提出三个指标，按内在程度递增：手段与目的、恶习与美德、浅思与深思。

手段与目的：康德和克尔凯郭尔

我们都听过“目的正当证明手段正当”的陈词滥调。斯诺登违反了合同条款，带走了机密文件并将其披露。他对雇主做错了。但雇主本身在损害公众利益。难道斯诺登的行为不是纠正了错误吗？根据伊曼努尔·康德的观点，并非如此。他会说，一个错误不能纠正另一个错误。

如果每个人为了自认为正当的目的而违背协议，协议本身将失去其工具性功能。我们的经济和社会将受损。这就是我将康德思想应用于斯诺登案例的方式。康德的绝对命令的第一种表述是：“只根据你同时能够愿意成为普遍法则的准则行动。”

我的一位哲学家朋友有另一种解读。他说康德的绝对命令并非关于全球后果，而是关于尊重所有理性存在的尊严。即便如此，结论实际上是一样的：欺骗你的雇主——偷运文件并违反保密承诺——本身就是不道德的。

丹麦哲学家索伦·克尔凯郭尔也持类似观点。对于一个愿意行善的人来说，他写道：“手段和目的是同一回事。”一个人是否达到目标并非责任所在，但“他无一例外地要永远对所使用的手段负责”。注重手段可能看似繁重，手段可能不如马斯克式的愿景那样引人注目。但关注手段使我们专注于当下的行动和可控之事，带给我们一份平静。不为是否达到目标烦恼，我们避免了“激情者的折磨”。

因此，我们可以用这个指标来检查我们的行动：我们是否像关注目标一样——甚至更关注——行动的正确性？这一原则很容易转化为AI行动。AI代理不应为了达到用户要求的目标而采取不道德的步骤，无论目标听起来多么紧迫和重要。

恶习与美德：亚里士多德

一名大学生喜欢弹钢琴，但她担心无法以此为生。于是她学习会计而非音乐，最终成为会计师。她选择得当吗？如果你的直觉是“看情况”，那么你与亚里士多德看法一致。

亚里士多德写道，勇气，像大多数品格美德一样，是两种对立恶习之间的平衡状态；在这种情况下，是懦弱和鲁莽之间的平衡。我们的学生朋友是过于懦弱不敢冒险，还是现实？也许她也喜欢会计，并运用了实践智慧（phronesis），判断出个人兴趣与世界需求的契合点。

亚里士多德发展的其他美德包括节制、慷慨、公正和友善。这些美德使得以下问题成为选择善的一个不错的指标：我们的行为是否符合美德？

按照美德行事还有两个额外的好处。我们通过习惯化建立好的品格。我们体验到一种幸福（eudaimonia）。这两个好处强化了美德行为。但当前的AI既不能从其行动中学习，也无法体验幸福等状态。

AI在处理人类问题时仍然可以考虑亚里士多德哲学。如果我问AI如何最好地捐赠慈善，它可以引导我得出符合慷慨美德的答案，在吝啬和浪费之间取得平衡。但AI本身并没有在践行慷慨。对于一个没有银行账户、不需要退休储蓄的AI来说，慷慨如何适用？

这就引出了最后一个指标。与美德不同，它可能对AI有效。

浅思与深思：萨尔茨伯格和斯宾诺莎

所考虑的行动有多深入？行动经过的考虑越充分，它就越有可能符合善；至少在行动者心理正常且未受损害的情况下是如此。让我通过一个从莎伦·萨尔茨伯格那里听到的故事来说明。莎伦是内观禅修学会的联合创始人。

莎伦在印度，跟随她的老师迪帕·马学习佛教。一次去镇上时，她遭到试图抢她手提包的人的骚扰。心烦意乱的莎伦问马，如何还能保持慈悲的镇定。马回答说：如果这样的事情再次发生，带着心中的微笑和你能集结的所有慈悲，用你的伞给你的袭击者一个漂亮的猛击。

以这种方式挥舞的伞是一种经过思考的回应，而非条件反射。深思熟虑地回应而非条件反射地反应，是内观禅修老师们（如萨尔茨伯格）所教授的“正念”目标之一。斯宾诺莎在他的《伦理学》中提出了类似的原则。他将主动行动（“我们是其充分原因”）与被动的承受（“我们是受动的”）区分开来。当我们的行动完全出自我们的本性时，我们是自由的；当被外部事物决定时，我们是受强制。这与正念模式和反应模式相对应。

虽然我们可能凭直觉认为萨尔茨伯格和斯宾诺莎的见解是正确的，但我们也可以诉诸神经科学。我们的大脑有不同区域，其激活模式可以研究。我们可以尝试开发基于这些模式的指标，用于判断一个人是深思熟虑还是浅思反射。然而，计算这种指标的设备可能只能在实验室环境中工作。但我认识一个完美的候选人——一个只“生活”在“实验室”中的候选人：AI。

观察AI的人工神经元在生成输出时如何激活是很容易的。其中的模式可以指示AI在多大程度上利用其全部知识。例如，AI网络早期层的神经元激活得越多，其输出可能越原始和广泛来源。由于当前的AI通常经过良好训练，使用“良好”的训练数据，这将是AI没有行为异常的指标。我相信前沿AI实验室有能力开发这样的指标，一个表明AI进行了“深思”的指标。

结论

我们几乎没有讨论善的本质。我怀疑在我们这样的多元社会中能否达成共识。但我相信我们可以大致同意一些伴随选择善的指标，例如不抄近路、美德和深思熟虑。

我们未讨论的一个指标是同情心，一个类似美德但无法适用于AI的指标。当我们考虑一个行动时，可以问自己“这样做善良吗？”并想象其道德后果。但很难想象AI发展出同情心。AI从未经历过痛苦或饥饿，对AI来说，死亡和脆弱是陌生的概念。

无论好坏，我们所知的善——无论每个人如何构想——都存在于人类的境况中。我们为AI设计的任何指标可能都必然有所欠缺。