自律型AI採用判断が擁護できない理由(私は採用AIを構築しています)
採用AIの構築者が、自律型AIによる採用判断の根本的な欠陥を論じる。AIモデルが依存する「優秀な人材」というラベルは、測定が遅く、交絡因子が多く、生存バイアスがかかっているため、モデルは過去の採用担当者の偏見を模倣するだけである。自動化は偏見を拡大し、説明責任を奪う。解決策はより良いモデルではなく、構造化された人間の判断:固定基準、全員からの同様の証拠収集、面接官の補助である。
私は採用AIを構築して生計を立てていますが、業界全体が競うように進めていることを批判したいと思います:ソフトウェアが独断で、あなたが人間の時間を割く価値がないと判断することです。最近仕事を探したことがあるなら、それに出会ったでしょう。応募すると、システムが履歴書を解析・採点し、ミリ秒単位で不合格を返す。誰も読んでいない。理由を尋ねることも、異議を申し立てることもできない。機械は自信満々で、それが会話の終わりです。
これに対する一般的な擁護論は、人間の方がひどいというものです。確かに人間の面接官は偏見があり、一貫性がなく、時間がかかります。第一印象は5分もかからずに形成され、その後すべてを静かに汚染します:質問は難しくなったり易しくなったり、同じ答えが自信または回避と読まれたり、面接官は候補者に対して「ただ感じた」と確信して出てくる。人間が嘘を見抜く精度は約54%で、コイン投げと変わらず、訓練された専門家も一般人と同程度です。これに対して、すべての応募者に同じ関数を適用するモデルは改善に聞こえます。一貫性は恣意性に勝ります。
しかし、実際の比較は「偏った人間の直感」対「一貫したモデル」ではありません。問題は数学ではなくラベルです。仕事で成功する人を予測するには、成功または失敗した人の例から学習する必要があります。そのラベルは採用において腐っています。「優秀な人材」は測定が遅く(測定されるとしても)、チーム、マネージャー、市場、運に交絡され、最悪なのは生存バイアスがかかっていることです:採用した人々の結果しか観察できず、何千人もの不合格者がどうなったかは分かりません。訓練信号はほぼ完全に過去の採用担当者の決定に基づいているため、モデルは「過去の人間が採用し維持した人」を予測することを学習し、偏見を含めて模倣します。
これはデータを増やせば解決する調整問題ではありません。構造化面接(相関r .51)は、一世紀の研究を経た人事選抜文献全体で最良の検証済み予測因子ですが、それでも口を閉ざして異議申し立てを認めない拒否を正当化するには程遠い。自律型採用判断を売り込む人は、科学が裏付けていない自信を主張しています。ラベルに偏見がエンコードされているなら、自動化は偏見を取り除くのではなく、洗浄し拡大します。偏った人間は年に数百人を拒否し、原則として問い詰められます。偏ったモデルはAPIを通じて数十万人を一貫して拒否し、「一貫性」が公正に見せかけます。規制当局はこれに気づき始めています。米国の選抜法は、採用ツールが使用前に検証され仕事関連性を持つことを数十年にわたって要求しています。表情分析で採点するAIを構築したベンダーは連邦告発を受け、静かに表情分析を中止しました。自動化された雇用決定は高リスクとして扱われつつあります。
たとえモデルが平均的に公平でも、「平均的に公平」は「この人にとって正当」と同じではありません。特定の人間が拒否され、彼らは平均が与えられないものを得る権利があります:決定を下した人間、理由を説明できる人間、間違っていて責任を取れる人間です。それを取り除けば、単なる不正ではなく、異議申し立ての宛先がない不正が生まれます。これがこの問題の道徳的核心です。
では代案は何か?人間の判断がひどいなら、なぜ人間に決定を戻すのか?悪い人間のプロセスを修正する方法は「人間を取り除く」ではなく、「人間を構造化する」ことです。直感的面接の欠点を指摘する同じ研究が、何が効果的かを教えています:会う前に固定基準を定義し、全員から同じ証拠を集め、候補者が実際に示したことを評価する。このように構造化すると、面接スコアの性差はほぼゼロになります。構造化は人間の偏見を減らす文書化された介入であり、責任ある人間をループから外さずに機能します。
これは機械の役割を再定義します。ソフトウェアの有用な役割は決定を下すことではなく、人間が良い決定を下すのを助けることです:証拠を提示し、基準を一定に保ち、回答が薄弱なところを指摘して、その場でさらに探る。機械は一貫性と記憶を扱い、人間は判断と説明責任を扱います。人間をループに残すことはコストと時間がかかり、怠惰な人間がツールの提案をゴム印で承認する可能性もあります。しかし、この最低限は重要です。自律型採用AIの問題は、それが人工的であることではなく、根拠なく自信を持ち、判断する相手に対して説明責任を負わないことです。私たちは10年かけて機械を高速化しました。より困難で正直なプロジェクトは、それが人間の価値を否定するたびに、人間に答えさせることです。