AI招聘工具可能導致種族偏見和系統性拒絕
首項針對實際招聘算法的大規模研究發現,AI篩選工具存在顯著的種族歧視,且因企業共同依賴同一供應商而形成“算法單一文化”,導致部分求職者被系統性拒絕。
畢業季來臨,2026屆畢業生正進入近年來最艱難的勞動力市場。入門級招聘放緩,而AI工具讓求職者更容易投遞大量申請。結果,崗位減少和申請激增使企業收到的入門級申請數量比2022年增加了近三倍。AI不僅改變了企業是否招聘,還改變了招聘方式。美國90%的僱主使用AI篩選工具來排序和排名求職者,且多數依賴少數幾家第三方供應商。當同一種算法影響眾多僱主時,對求職者意味着什麼?
我們對340萬人進行了跟蹤,他們向150家僱主、11個行業領域的1700個職位提交了400萬份申請。每份申請都由同一家第三方供應商開發的AI招聘工具評估。我們的新論文罕見地揭示了算法招聘的“黑箱”,表明這些工具加劇了種族偏見,並將同一批人排除在所有申請的工作之外。
大規模揭示種族偏見
我們發現AI候選人篩選存在種族差異的實質性證據。為衡量不利影響,我們採用了美國平等就業機會委員會(EEOC)的“五分之四規則”,即當一個羣體的推薦率低於最受推薦羣體推薦率的80%時,該職位即被視為存在歧視。我們發現,26%的黑人申請者和15%的亞裔申請者所申請的職位存在AI系統對其種族的歧視。如果AI以與最受青睞羣體(通常是白人)相同的比例推薦黑人和亞裔,那麼將有4萬份更多的申請進入招聘的下一階段。
如何衡量不利影響至關重要。我們研究的供應商為不同僱主的眾多職位篩選申請者。如果將供應商的所有推薦彙總在一起,視為一個大型招聘流程,則未發現不利影響。但如果像通常的不利影響評估那樣,逐個職位進行分析,就會暴露許多職位中的不利影響。例如,假設AI工具經常推薦黑人申請倉庫工作,但很少推薦他們做金融工作。如果將所有職位平均,這兩個模式會相互抵消,似乎沒有歧視。宏觀平均掩蓋了逐職位發生的真實歧視。
算法單一文化導致系統性拒絕
我們還研究了因共同依賴同一招聘供應商而帶來的新問題。在之前的工作中,我們提出理論假設:算法單一文化(即許多僱主依賴相同的算法推薦)可能導致一些人被排除在工作之外。利用我們的大型真實招聘AI推薦數據集,我們驗證了這一假設。我們發現,提交多份申請至同一算法招聘供應商篩選的職位的人,比企業在統計上獨立決策時,更有可能被所有申請的職位拒絕。提交四份申請的求職者中,有10%被所有申請的單位拒絕。
我們的研究還發現,在其他情況下這種模式並不明顯。我們分析了同期進行的最大規模招聘決策研究數據,該研究向108家財富500強公司發送了8.3萬份申請,且未關注是否使用AI。我們發現,在該數據中,求職者被所有申請公司拒絕的比例並不高於各公司獨立決策時的預期值。這表明市場集中度很重要:當一個招聘供應商開始主導一個行業的篩選時,候選人被排除的可能性就會增加。
AI篩選工具將三個不應共存於高風險決策中的特性結合在一起:廣泛採用、高度影響和對公眾不透明。我們的研究為揭示AI招聘工具的後果取得了進展,但這項技術的許多影響仍不清楚。隨着基於語言模型和智能體的新工具的出現,這一領域正在快速演變。這項工作的重要教訓是,對算法招聘進行獨立研究具有價值和必要性。沒有獨立研究,就很難推行基於證據的AI政策來管理AI對個人就業前景和整體勞動力構成的影響。