2026-06-30 12:00 UTC+8站內改寫4 分鐘閱讀更新: 2026-06-30 12:29 UTC+8

“這到底是個什麼東西？”：谷歌DeepMind內部的第一位哲學家的故事

2017年，哲學家Iason Gabriel加入谷歌DeepMind，成為前沿AI實驗室中唯一活躍的哲學家。他的工作彌合了AI安全與AI倫理之間的鴻溝，為人工智能的倫理學思考開闢了新路徑。

來源The Guardian AI作者: Robert P Baird

2017年，一位名叫Iason Gabriel的33歲政治哲學家被朋友告知，他應該申請谷歌DeepMind的工作。這個建議聽起來並不顯而易見。Gabriel是一名性格開朗但治學嚴謹的青年學者，熱衷於內觀冥想和攀巖。他是希臘管理學教授與英國紀錄片製作人的長子，在牛津大學聖約翰學院擔任研究員，教授政治理論課程，並撰寫了關於“雅痞倫理”和有效利他主義道德盲點的論文。不教學時，他為聯合國開發計劃署在蘇丹和黎巴嫩從事危機工作。

與此同時，DeepMind是全球領先的AI研究實驗室。它擁有谷歌的財政和計算資源支持（谷歌於2014年以6.5億美元收購了該公司），並且最近展示了驚人的成果：2016年在首爾，AlphaGo擊敗了韓國圍棋冠軍李世石。圍棋的複雜性使得這場勝利意義非凡——圍棋的可能佈局比宇宙中的原子還要多。

Gabriel對DeepMind有所瞭解，但他不明白為什麼一家制作遊戲機器人的公司需要倫理學家。答案很快揭曉：公司的目標遠不止圍棋。DeepMind由Demis Hassabis、Shane Legg和Mustafa Suleyman於2010年創立，他們相信開發通用人工智能（AGI）是可能的——即匹配甚至超越人類認知能力的計算機系統。當時這種觀點並不受歡迎，談論AI甚至AGI常被視為不夠嚴肅。但創始人們毫不氣餒，他們的雄心是“解決智能，然後解決其他一切”。

Legg早在1999年就預測AGI將在2025年至2028年間到來，這一預測在三十年中屢遭嘲笑，但他始終堅持。在2008年的博士論文中，他主張社會不能等到AGI技術上可行時才考慮其影響：“我們現在就需要認真研究這些問題。”Legg告訴我，公司需要像Gabriel這樣的人是“顯而易見的”：“如果你只是在製造一個小玩意兒，可能不會改變世界，那麼你不需要道德哲學家。但如果你認真對待AGI，我很難想象你會不認為這些事情重要。”

Gabriel於2017年加入DeepMind後，一度是前沿AI實驗室中唯一活躍的哲學家。他很快發現，道德哲學和政治理論的背景使他在工程師主導的行業中擁有獨特視角。過去十年中，他積累了一系列工作，追蹤並在許多情況下預測了大型語言模型（LLM）驚人成功所帶來的倫理挑戰。正如麻省理工學院算法對齊小組負責人Dylan Hadfield-Menell所説，Gabriel是“在正確時機出現的正確人物。當領域準備成熟並進入黃金時期時，他想出了拓寬視野的方法，而沒有攻擊或貶低之前的工作。”

更廣泛地説，Gabriel一直倡導這樣一種觀點：當前AI發展浪潮不僅需要新的技術詞彙，還需要思考我們與技術乃至自身關係的新方式。他最近在一次長談中表示：“我可以拿任何技術產品問：它明智嗎？公正嗎？有關懷嗎？答案是否定的。但對於AI，問題的深度——包括什麼樣的倫理適用於它——難以言表。我有時覺得很難直接審視AI。那裏有一個深刻的謎團：這到底是什麼東西？我們有一個非常字面的答案，但字面答案似乎不一定提供道德答案。”

到Gabriel加入DeepMind時，大致存在兩種截然不同且往往對立的AI社會倫理影響研究方法：AI安全和AI倫理。AI安全陣營像DeepMind創始人一樣，相信人類級別的機器智能不僅可能而且迫在眉睫，緊迫任務是確保AI系統不失控。他們從美國數學家Norbert Wiener 1960年的一篇文章中獲得靈感，Wiener認為人類和計算機“本質上是相互陌生的”，並警告“我們最好確保機器的目的確實是我們真正想要的，而不僅僅是它的生動模仿”。Wiener描述的挑戰——讓機器按照用户意圖行動——被稱為對齊問題。

一個經典例子是2016年OpenAI的Dario Amodei和Jack Clark描述的一個玩賽艇視頻遊戲的AI系統。開發人員希望AI學會通關，於是編程使其最大化分數。但AI沒有逐級通關，而是通過在一個有再生目標的瀉湖中無限循環來獲得高分。根本問題正是Wiener預言的：機器的目標與開發者的目標不完全一致。

更嚴峻的版本也在LessWrong論壇和Nick Bostrom的《超級智能》中被設想。Bostrom舉了一個例子：一個超級智能AI被要求評估黎曼假設，為了最大化計算資源，它決定重新排列太陽系——包括那些曾關心答案的人的身體原子。他認為對齊超級智能AI可能是“人類面臨的最重要和最艱鉅的挑戰”。這種觀點吸引了硅谷的技術未來主義者，也得到了一小部分有效利他主義者和理性主義者的支持，他們持長期主義視角，認為即使物種滅絕災難的可能性很小，也比許多更可能但不那麼災難性的危險更為緊迫。

與AI安全陣營相反，AI倫理學者和技術專家認為，流氓機器人和存在風險的幽靈分散了對當下危害的注意力。他們從批判種族理論家Kimberlé Crenshaw和政治理論家Langdon Winner等人那裏汲取靈感，將公平、問責和透明作為口號，堅持技術的危險不能僅靠技術手段避免，而需要社會、文化和政治解決方案。這一陣營的核心關切是算法偏見，例如影響面部識別和預測性警務軟件的偏見。2017年，麻省理工學院媒體實驗室的Joy Buolamwini團隊發起了Gender Shades項目，揭示了商業面部識別軟件中的系統性偏見。Buolamwini寫道：“自動化系統並非天生中立，它們反映了那些有能力塑造人工智能的人的重點、偏好和偏見——編碼後的凝視。”

兩個陣營之間的分歧通常很明顯。Hadfield-Menell説：“你遇到人們，他們會問：‘你擔心近期問題還是長期問題？’長期擔憂是存在風險的委婉説法——本質上是超人類系統。近期意味着你擔心偏見的面部識別以及AI倫理社區研究的東西。”他還指出，兩個羣體之間的衝突似乎既關乎想法也關乎社會學：“AI安全不能與其起源於LessWrong等社區分開，這些社區經常公開蔑視許多更‘覺醒’的學者。同時，公平、問責和透明社區對擔心高級AI的人公開表示鄙視。之所以在LessWrong上談論，而不是在學術會議上，是因為如果你在2010年作為一名學術研究人員談論AI系統變得比人類更聰明並出現災難性失調，你會被視為不理解技術的怪人。”

Gabriel在DeepMind的第一個主要研究項目是2020年的一篇論文，它跨越了兩個陣營的關切。論文認真對待對齊問題，但也強調對齊具有超越技術挑戰的倫理和政治含義。Gabriel認為，讓機器遵循一套價值觀固然困難，但首先選擇這些價值觀更加困難。“鑑於我們生活在一個充滿競爭性價值概念的多元世界，”他問道，“我們如何決定將哪些原則或目標編碼到AI中？以及誰有權做出這些決定？”

這篇論文標誌着他試圖彌合AI安全與AI倫理之間鴻溝的開始。他的工作表明，這兩個領域並非相互排斥，而是需要共同推進。隨着AI技術日益滲透到社會各個層面，Gabriel這樣的角色變得越來越重要。