2026-06-02 22:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

為何不測量AI對人類的影響？

隨着AI系統能力提升，大量資源用於衡量AI性能，但對其對人類認知、關係和行為的影響卻缺乏系統測量。人道技術中心的Imran Khan指出，AI可能重塑人類基本能力，而當前評估體系忽視了最關鍵的指標——人類福祉。文章討論了AI在社交、教育、情感支持等領域的潛在危害，並呼籲長期研究、數據共享和監管改革。

來源IEEE Spectrum AI作者: Vanessa Bates Ramirez

隨着人工智能系統能力不斷提升，大量資源和精力被投入到衡量其技術性能上。研究人員關注技術評估指標，對AI進行推理測試，追蹤其吞吐量等等。然而，有一個關鍵指標常常被忽視，而這個指標可以説是最重要的：AI對人類做了什麼？

非營利組織“人道技術中心”的心理社會評估負責人伊姆蘭·汗在最近的一篇文章中指出，我們正在部署能夠重塑認知、關係和行為的AI工具，但卻幾乎沒有系統地衡量它們對我們的下游影響。這種對AI心理社會效應的關注，類似於社交媒體及其危害的討論，但汗認為AI的影響可能更廣泛、更親密。

在IEEE Spectrum與汗的對話中，他解釋了為何AI評估如此狹窄，如何有意義地衡量人類結果，以及AI行業是否有動力提出這些問題。汗表示，我們花費大量精力去測量AI在一些抽象任務上的表現，這些任務與大多數人的日常生活關係有限，但AI對人類福祉的影響卻測量得少得多。這形成了一個奇怪的悖論：我們最應該關心的事情，卻測量得最少。

汗提到了一些高調案例，他認為這些只是冰山一角——青少年自殺、AI精神病、人們花費大量時間或金錢與諂媚的AI聊天機器人互動。他認為這些危害已經存在，但由於公眾壓力，OpenAI已經調整了其聊天模型，這表明實驗室會關注並回應審查。因此，我們有潛力改變技術方向，使其既有用又減少傷害。

然而，在社會層面的危害更難把握。汗擔心如果不盡快開始測量這些現象，將會為時已晚。他批評了AI公司認為用户最看重便利性和生產力的説法，指出用户往往有矛盾的需求。我們需要理解的不只是用户在忙碌或高壓力時做出的選擇，而是他們希望與這項技術建立什麼樣的健康關係。

汗特別強調了幾個關鍵領域：情感陪伴與支持，兒童與青少年使用，教育，以及危機響應。他認為，當人們孤獨時，真正需要的是另一個人類，而AI無法真正關心你。在兒童與青少年身上，我們不知道移除認知任務或情感參與的門檻會對發育中的大腦產生什麼長期影響。

為了衡量AI的社會影響，汗呼籲進行長期研究，類似於藥品上市後的監測。他主張開放更多數據給外部研究人員，同時保護隱私。他還提到，行業整體有動力分享數據以建立信任，而責任制度是另一個槓桿。理想情況下，監管應包含責任，但不應完全依賴不穩定的政治環境。

展望五年後，汗認為成功將是匯聚AI實驗室、政府、監管機構、大學和初創公司的專業知識，共同定義人類與AI之間的良好關係。他擔心如果現在不開始瞭解這些技術的人類效應，我們將遠遠落後於曲線，無法評估未來的變化。