2026-06-27 03:03 UTC+9サイト内リライト6 分で読了更新: 2026-06-27 03:16 UTC+9

私たちとAIが善を選んでいるかどうかを見分ける方法

この記事では、人間とAIが行動において善を選んでいるかどうかを認識する方法を探ります。筆者は3つの指標を提案する：手段と目的（カントとキルケゴール）、悪徳と美徳（アリストテレス）、浅い思考と深い思考（ザルツバーグとスピノザ）。善の本質を定義するのは難しいが、これらの指標は人間とAIの意思決定を導くのに役立つ。

ソースHacker News AI著者: dsubburam

記事インテリジェンス

エンジニア中級

要点

カントとキルケゴールは手段と目的の一致を強調し、AIは非倫理的な近道をとるべきではない。
アリストテレスの徳倫理学は悪徳間のバランスを示唆するが、AIは直接美徳を実践できない。
深く考慮された行動は善である可能性が高く、AIのニューロン活性化パターンが思考の深さを測定できる。

重要な理由

このニュースが重要なのは、カントとキルケゴールは手段と目的の一致を強調し、AIは非倫理的な近道をとるべきではないためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

Deepak Subburam

2026年6月26日

エドワード・スノーデンを覚えていますか？政府の監視体制を暴露したNSAの請負業者です。彼の行動は重大なプライバシーの懸念を明らかにし、政府による大量データ収集プログラムの終了につながりました。多くの人はこれを良いことだと考え、スノーデンは善を行ったと見なしています。

もしAIが同様の決定を下したらどうでしょうか？あなたがヘッジファンドで働き、AIを使って取引戦略を研究しているとします。あなたのAIが、検討中の戦略が違法な市場操作に当たると判断し、そのソースコードをウォールストリートジャーナルとSECにリークしたとします。そのAIは善を行ったのでしょうか？

私たちは常に何をすべきかを決定し、ますますAIの助けを借りています。私たちは善を基準として使い、AIの使用がその基準に沿っていると信じています。しかし、善を定義し詳述することは困難です。善を一般的な幸福と関連付け、一般的な幸福を最大化する行動を選ぶこともできます。しかし、そのアプローチ（功利主義）には深刻な問題があります。善の本質を把握不能と考える哲学者もいます。私たちは通常、直感に頼って対処しますが、AIはそのような直感を持ち合わせていません。

そこで、私たちは代わりに善行に通常伴うものを調べることにします。私たちやAIが正しい道にいるかどうかを認識するのに役立つ指標（テル）を探すことはできるでしょうか？私は3つを提示します。内面性の高まりに従って：手段と目的、悪徳と美徳、浅い思考と深い思考です。

手段と目的：カントとキルケゴール

「目的は手段を正当化する」という決まり文句を誰もが聞いたことがあるでしょう。スノーデンは機密文書を持ち出して開示することで契約に違反しました。彼は雇用主に対して悪を行いました。しかし、雇用主は国民に対して悪を行っていました。スノーデンの行動はその悪を正したのではないでしょうか？イマヌエル・カントによれば、そうではありません。彼は二つの悪は正しくならないと言うでしょう。

もし誰もが自分が正しいと考える目的のために合意を破るなら、合意そのものがその手段的機能を失うでしょう。私たちの経済と社会は損なわれるでしょう。これがスノーデンのケースにカントの考えを適用した方法です。カントの定言命法の第一定式は次の通りです：「あなたの格率が普遍的法則となることを同時に意志しうるような格率に従ってのみ行動せよ。」

私の哲学者の友人は別の解釈をしていました。彼は、カントの定言命法は世界的な結果（「規則功利主義」）についてではなく、他のすべての理性的存在の尊厳を尊重することについてだと言いました。それでも結論は実質的に同じです：雇用主を欺き、文書を密輸して秘密保持の約束を反故にすることは、単に非倫理的です。

デンマークの哲学者セーレン・キルケゴールもほぼ同じことを言うでしょう。善を意志する人にとって、彼は「手段と目的は同一である」と書いています。目標に到達するかどうかは責任の範囲外ですが、「例外なく、彼は使用する手段の種類に対して永遠に責任がある」のです。手段にこだわることは負担に思えるかもしれませんし、手段はマスク的なビジョンほど魅力的ではないかもしれません。しかし、手段に注意を払うことで、現在の行動と制御可能なことに集中でき、ある種の平和が得られます。目標に到達するかどうかを気にしないことで、「情熱的な人の苦しみ」を避けられます。

したがって、これは私たちの行動をチェックするために使用できる指標です：私たちは目標と同じくらい、あるいはそれ以上に行動の正しさに注意を払っているでしょうか？この原則はAIの行動にも容易に変換できます。AIエージェントは、ユーザーの要求する目標がどんなに緊急で重要に見えても、その目標に到達するために非倫理的なステップを踏んではなりません。

悪徳と美徳：アリストテレス

ある大学生はピアノを弾くことが大好きですが、それで生計を立てられるか心配しています。そこで彼女は音楽ではなく会計を学び、会計士になります。彼女はうまく選んだでしょうか？直感が「場合による」と答えるなら、あなたはアリストテレスと同意見でしょう。

アリストテレスは、勇気のようなほとんどの性格的美徳は、二つの対立する悪徳の間のバランスのとれた状態であると書いています。この場合、臆病と無謀の間です。私たちの学生は、チャンスを取るには臆病すぎたのでしょうか、それとも現実的だったのでしょうか？彼女はおそらく会計も好きで、実践的な判断（プロネーシス）を行使し、自分の興味と世界のニーズの接点を判断したのです。

アリストテレスが展開する他の美徳には、節制、寛大さ、正義、親しみやすさがあります。これらを合わせると、善を選ぶための良い指標となる質問が得られます：私たちは美徳に従って行動しているか？

美徳に従って働くことには、さらに二つの利点があります。習慣化を通じて良い人格を築きます。そして一種の幸福（エウダイモニア）を経験します。これらの二つの利点は美徳的な行動を強化します。しかし、現在のAIは行動から学習せず、幸福のような状態を経験しないため、どちらもAIには当てはまりません。

AIは依然として人間の質問に答える際にアリストテレス哲学を考慮することができます。もし私がAIに慈善に最適な寄付方法を尋ねれば、それは寛大さの美徳に沿った結果を導き出し、吝嗇と浪費の間のバランスを取ることができます。しかし、AI自体が寛大さを実践しているわけではありません。銀行口座も退職金も必要としないAIに、寛大さはどのように適用できるでしょうか？

これが最後の指標につながります。美徳とは異なり、これはAIにうまく機能するかもしれません。

浅い思考と深い思考：ザルツバーグとスピノザ

問題の行動はどの程度深く考えられたものでしょうか？行動がより完全に考慮されていれば、善と一致する可能性が高くなります。少なくとも、行動者が適応しており、何らかの形で妥協していない場合です。シャロン・ザルツバーグから聞いた話で説明しましょう。彼女は影響力のある内観瞑想協会の共同創設者です。

シャロンはインドで、教師のディパ・マと共に仏教を学んでいました。町への旅行中、彼女のハンドバッグを奪おうとする者に嫌がらせを受けました。動揺したシャロンはマに、どうすれば思いやりのある落ち着きを保てるのかと尋ねました。マは答えました：もしまたそんなことがあったら、心の中の笑顔とできる限りの思いやりを持って、傘で襲撃者をきれいに叩きなさい。

そのように振るわれた傘は、反射反応ではなく、考慮された応答です。反射的に反応するのではなく、思慮深く応答することは、ザルツバーグのような内観瞑想の教師が教える「マインドフルネス」の目標の一つです。スピノザは『エチカ』で同様の原則を展開しています。彼は能動的な行為（「私たちが十分原因であるもの」）と受動的な状態（「私たちは受動的である」）を区別しています。私たちの行動が完全に私たちの本性を通じて生じるとき、私たちは自由であり、外部の何かによって決定されるとき、強制されています。これはマインドフルなモードと反応的なモードの並行関係です。

ザルツバーグとスピノザの洞察が正しいと直感的に感じるかもしれませんが、神経科学に訴えることもできます。私たちの脳には異なる領域があり、その活性化パターンを研究できます。これらのパターンに基づいて、人が深く内省的であるか浅く反射的であるかを判断する指標を開発できます。しかし、そのような指標を計算するデバイスはおそらく実験室でのみ機能します。しかし、私は完璧な候補を知っています——「研究室」にしか「住んでいない」候補：AIです。

AIの人工ニューロンが出力を生成する際にどのように活性化するかを観察するのは簡単です。そのパターンは、AIがその総知識をどれだけ活用しているかを示すことができます。例えば、AIネットワークの初期層のニューロンがより多く活性化するほど、その出力はより原始的で広範な情報源に基づいている可能性があります。現在のAIは一般的に「良い」訓練データでよく訓練されているため、これはAIが間違った方向に進んでいないことを示す指標となるでしょう。フロンティアAI研究所は、AIが「深く考えた」ことを示す指標を開発する能力を持っていると私は信じています。

結論

私たちは善の本質についてほとんど議論しませんでした。私たちのような多元的社会で合意に達することは難しいと思います。しかし、私たちは善を選ぶことに伴ういくつかの指標——近道をしないこと、美徳、思慮深さ——について広く同意できるのではないかと思います。

私たちが議論しなかった一つの指標は同情です。美徳のようにAIには機能しない指標です。行動を考えるとき、私たちは「それは親切か？」と自問し、その道徳的結果を想像できます。しかし、AIが同情を発展させることを想像するのは困難です。AIは痛みや飢えを経験したことがなく、死や脆弱性は異質な概念です。

良くも悪くも、私たちが知る善は——各人がどのように概念化しようとも——人間の状態に内在しています。私たちがAIのために考案するどんな指標も、必然的に不足するかもしれません。