如何判断我们——以及人工智能——是否在行善
本文探讨了如何识别人类和AI在行动中是否选择了善。作者提出三个指标:手段与目的(康德和克尔凯郭尔)、恶习与美德(亚里士多德)、浅思与深思(萨尔茨伯格和斯宾诺莎)。虽然善的本质难以定义,但这些指标可以帮助我们和AI在决策时保持正轨。
Deepak Subburam
2026年6月26日
还记得爱德华·斯诺登吗?这位NSA承包商泄露了机密文件,揭露了政府的监控系统。他的行为引发了重大隐私担忧,并导致政府终止了其大规模数据收集计划。许多人认为这是一件好事,斯诺登做了善事。
如果某个AI做出了类似的决定呢?假设你在一家对冲基金工作,正在使用AI研究交易策略。你的AI判断你正在考虑的策略构成了非法市场操纵,于是将你的源代码泄露给《华尔街日报》和美国证券交易委员会。这个AI做了善事吗?
我们不断决定做什么,并越来越多地借助AI的帮助。我们将善作为标准,并相信我们的AI使用符合这一标准。然而,善很难定义和阐述。我们可以将善与普遍幸福联系起来,选择最大化普遍幸福的行为。但这种方法——功利主义——存在严重问题。有些哲学家认为善的本质问题是无法解决的。我们通常依靠直觉行事,而AI不具备这种能力。
因此,我们转而审视通常伴随善行的是什么。我们能否寻找一些指标,帮助我们的AI识别何时走在正轨上?我提出三个指标,按内在程度递增:手段与目的、恶习与美德、浅思与深思。
手段与目的:康德和克尔凯郭尔
我们都听过“目的正当证明手段正当”的陈词滥调。斯诺登违反了合同条款,带走了机密文件并将其披露。他对雇主做错了。但雇主本身在损害公众利益。难道斯诺登的行为不是纠正了错误吗?根据伊曼努尔·康德的观点,并非如此。他会说,一个错误不能纠正另一个错误。
如果每个人为了自认为正当的目的而违背协议,协议本身将失去其工具性功能。我们的经济和社会将受损。这就是我将康德思想应用于斯诺登案例的方式。康德的绝对命令的第一种表述是:“只根据你同时能够愿意成为普遍法则的准则行动。”
我的一位哲学家朋友有另一种解读。他说康德的绝对命令并非关于全球后果,而是关于尊重所有理性存在的尊严。即便如此,结论实际上是一样的:欺骗你的雇主——偷运文件并违反保密承诺——本身就是不道德的。
丹麦哲学家索伦·克尔凯郭尔也持类似观点。对于一个愿意行善的人来说,他写道:“手段和目的是同一回事。”一个人是否达到目标并非责任所在,但“他无一例外地要永远对所使用的手段负责”。注重手段可能看似繁重,手段可能不如马斯克式的愿景那样引人注目。但关注手段使我们专注于当下的行动和可控之事,带给我们一份平静。不为是否达到目标烦恼,我们避免了“激情者的折磨”。
因此,我们可以用这个指标来检查我们的行动:我们是否像关注目标一样——甚至更关注——行动的正确性?这一原则很容易转化为AI行动。AI代理不应为了达到用户要求的目标而采取不道德的步骤,无论目标听起来多么紧迫和重要。
恶习与美德:亚里士多德
一名大学生喜欢弹钢琴,但她担心无法以此为生。于是她学习会计而非音乐,最终成为会计师。她选择得当吗?如果你的直觉是“看情况”,那么你与亚里士多德看法一致。
亚里士多德写道,勇气,像大多数品格美德一样,是两种对立恶习之间的平衡状态;在这种情况下,是懦弱和鲁莽之间的平衡。我们的学生朋友是过于懦弱不敢冒险,还是现实?也许她也喜欢会计,并运用了实践智慧(phronesis),判断出个人兴趣与世界需求的契合点。
亚里士多德发展的其他美德包括节制、慷慨、公正和友善。这些美德使得以下问题成为选择善的一个不错的指标:我们的行为是否符合美德?
按照美德行事还有两个额外的好处。我们通过习惯化建立好的品格。我们体验到一种幸福(eudaimonia)。这两个好处强化了美德行为。但当前的AI既不能从其行动中学习,也无法体验幸福等状态。
AI在处理人类问题时仍然可以考虑亚里士多德哲学。如果我问AI如何最好地捐赠慈善,它可以引导我得出符合慷慨美德的答案,在吝啬和浪费之间取得平衡。但AI本身并没有在践行慷慨。对于一个没有银行账户、不需要退休储蓄的AI来说,慷慨如何适用?
这就引出了最后一个指标。与美德不同,它可能对AI有效。
浅思与深思:萨尔茨伯格和斯宾诺莎
所考虑的行动有多深入?行动经过的考虑越充分,它就越有可能符合善;至少在行动者心理正常且未受损害的情况下是如此。让我通过一个从莎伦·萨尔茨伯格那里听到的故事来说明。莎伦是内观禅修学会的联合创始人。
莎伦在印度,跟随她的老师迪帕·马学习佛教。一次去镇上时,她遭到试图抢她手提包的人的骚扰。心烦意乱的莎伦问马,如何还能保持慈悲的镇定。马回答说:如果这样的事情再次发生,带着心中的微笑和你能集结的所有慈悲,用你的伞给你的袭击者一个漂亮的猛击。
以这种方式挥舞的伞是一种经过思考的回应,而非条件反射。深思熟虑地回应而非条件反射地反应,是内观禅修老师们(如萨尔茨伯格)所教授的“正念”目标之一。斯宾诺莎在他的《伦理学》中提出了类似的原则。他将主动行动(“我们是其充分原因”)与被动的承受(“我们是受动的”)区分开来。当我们的行动完全出自我们的本性时,我们是自由的;当被外部事物决定时,我们是受强制。这与正念模式和反应模式相对应。
虽然我们可能凭直觉认为萨尔茨伯格和斯宾诺莎的见解是正确的,但我们也可以诉诸神经科学。我们的大脑有不同区域,其激活模式可以研究。我们可以尝试开发基于这些模式的指标,用于判断一个人是深思熟虑还是浅思反射。然而,计算这种指标的设备可能只能在实验室环境中工作。但我认识一个完美的候选人——一个只“生活”在“实验室”中的候选人:AI。
观察AI的人工神经元在生成输出时如何激活是很容易的。其中的模式可以指示AI在多大程度上利用其全部知识。例如,AI网络早期层的神经元激活得越多,其输出可能越原始和广泛来源。由于当前的AI通常经过良好训练,使用“良好”的训练数据,这将是AI没有行为异常的指标。我相信前沿AI实验室有能力开发这样的指标,一个表明AI进行了“深思”的指标。
结论
我们几乎没有讨论善的本质。我怀疑在我们这样的多元社会中能否达成共识。但我相信我们可以大致同意一些伴随选择善的指标,例如不抄近路、美德和深思熟虑。
我们未讨论的一个指标是同情心,一个类似美德但无法适用于AI的指标。当我们考虑一个行动时,可以问自己“这样做善良吗?”并想象其道德后果。但很难想象AI发展出同情心。AI从未经历过痛苦或饥饿,对AI来说,死亡和脆弱是陌生的概念。
无论好坏,我们所知的善——无论每个人如何构想——都存在于人类的境况中。我们为AI设计的任何指标可能都必然有所欠缺。