2026-06-15站内改写4 分鐘閱讀更新: 2026-06-15

擴充套件AI驅動的客戶服務，同時不失去客戶信任

AI正在降低客戶服務成本，但也可能加速組織風險。斯坦福大學的研究顯示，通用AI聊天機器人在法律查詢中的幻覺率高達58%-82%。當AI無法解決問題時，品牌淨推薦值可能驟降70點。本文探討了企業如何在部署生成式AI時保持組織準備度，包括信任門檻、確定性AI基礎以及升級設計等關鍵洞察。

來源Emerj AI Research作者: Marilie Fouche

AI正在降低客戶服務成本，但同時也可能加速組織風險。真正的高管問題不在於是否部署AI，而在於企業是否建立了足夠的準備度，以承受在客戶面前失敗的時刻。斯坦福大學RegLab的研究表明，通用AI聊天機器人在法律查詢中的幻覺率在58%到82%之間，即使是專門構建的法律AI工具在至少六分之一的基準案例中也會產生幻覺。斯坦福HAI 2026年AI指數報告顯示，26個領先模型的幻覺率從22%到94%不等，2025年記錄的AI事件達到362起，高於前一年的233起。

消費者金融保護局（CFPB）警告說，當客戶服務聊天機器人失敗時，它們不僅會破壞客戶信任，還可能造成廣泛傷害，當設計不佳的聊天機器人技術導致消費者選擇錯誤產品、誤解費用或失去訪問糾紛處理渠道時，金融機構將面臨積極的法律責任。聯邦貿易委員會（FTC）和其他三個聯邦機構於2023年12月聯合承諾，將積極執行現有法律，針對對消費者產生有害結果的AI工具。

獨立客戶運營標準機構COPC Inc.對六個國家的1000多名消費者進行的全球調查發現，當AI完全解決客戶問題而不需要進一步步驟時，滿意度超過90%，但當AI未能解決問題時，品牌的淨推薦值可能驟降70點。同一研究還發現，從AI到人工代理的交接是所有研究市場中一致的失敗點——問題不在於AI模型本身，而在於背後的工作流設計。

Adobe客戶體驗高階總監Robert Rose在Emerj的AI in Business播客中與Matthew DeMello探討了AI在客戶服務中的成熟曲線，並概述了企業在安全地將這些能力擴充套件到客戶之前必須做好的準備。本文從Adobe的Robert Rose的見解中提取了三個關鍵洞察，探討企業如何在客戶服務中部署生成式AI，而不會超越其組織準備度：

信任門檻作為部署地圖：客戶對AI的接受度與互動風險成反比，部署順序必須反映這一現實。人們多年來一直在與AI系統互動，通常沒有意識到這一點，在低風險情況下，這幾乎不會產生摩擦。但當後果上升——賬單糾紛、財務決策、醫療問題——信任收緊，容忍度變窄。這建立了一個自然的部署地圖。一些互動已準備好自動化，其他需要監督，有些必須保持人工主導，直到贏得信任。排序不是由技術能力決定的，而是由客戶願意讓AI做什麼決定的。Rose強調，這條曲線在移動，但不是按照企業的時間表。客戶決定信任何時擴大，超前於該曲線的部署會引發挫敗感和流失。

嵌入在這個信任問題中的是一個戰略決策，大多數企業現在都在悄悄做出——是否告知客戶他們在與AI交談。Rose將其視為品牌和運營問題，而不是倫理問題：“公司實際上在考慮不告訴客戶它是一個機器人，只是讓他們與這個東西互動，直到我們感覺到它不工作，然後我們將你轉給一個人。我們不會告訴你——但這真的取決於公司。”對高管的影響是直接的。披露決定不再是一個預設設定——它是一個有雙向後果的選擇。披露AI設定了期望，並在系統失敗時保護品牌。不披露則提高了每次失敗的代價，因為客戶感到被誤導，而不僅僅是服務不足。高管需要對此有一個深思熟慮的立場，而不是從供應商實施中繼承的立場。

根據Rose的框架，部署細分如下：

低風險交易互動：AI現在可以自主操作
中等風險互動：AI在人工監督下是當前標準
高風險受監管互動：人工主導，AI輔助，直到信任建立

確定性AI基礎作為生成式個性化的前提：Rose區分了大多數企業AI路線圖忽略的一點：預測性AI和生成式AI不可互換，它們是順序的。預測性系統遵循規則和模式，生成式系統產生響應。如果沒有可靠的確定性層在下面，這些響應就沒有基礎。這種治理轉變是重大的。在預測性AI時代，公司對機器人進行程式設計——如果這個問題進來，你就這樣回答。生成式AI完全移除了這個約束。系統根據它有權訪問的資料決定說什麼。這就是能力擴充套件的地方，也是風險進入的地方。

他直接解釋了失敗模式：“它們會編造東西。實際上，它們不是真的編造——它們只是從某個地方找到了資訊，然後誤解了資訊，並推薦了它，但上下文不對。”生成式AI已經在帶來價值的地方——即使在人工監督下——是響應個性化。Adobe高管描述了一種當前可用且可在正確監督模型下立即部署的能力：“它可以根據個人資料、最近的互動——這個客戶通常生氣嗎？還是現在生氣？如果是，我會加入一些安撫的詞語。生成式AI今天就能做到所有這些。”這種能力——即時情感感知響應生成——是生成式AI在客戶服務中的近期價值案例。但Rose明確表示，它需要成人監督。他建議組織如何在不承擔責任的情況下捕捉這一價值：“這些公司最好的做法可能是在內部進行實驗，讓人眼審視它並說，‘嘿，這很好’，然後利用你所得到的，並在交付給客戶之前進行調節。”

Rose為高管暗示的排序清單：

預測性AI正在產生組織能夠辯護的輸出
客戶資料結構化和穩定，足以讓生成式模型準確提取
內部生成式輸出在接觸客戶之前經過審查
法律和風險團隊參與部署過程，而不是接收一個完成的系統

當法律團隊提出反對時，Rose將其視為確定性基礎尚不足以支援大規模生成式個性化的訊號。這種抵抗是診斷性的，而不是阻礙性的。

升級設計作為服務AI成熟度的衡量標準：Rose重新解讀了客戶服務AI中最常被誤讀的訊號之一。當客戶重複“代表，代表”時，失敗不在於模型，而在於工作流。系統要麼未能及早檢測到挫敗感，要麼以迫使客戶重新開始的方式轉交了客戶。大多陣列織透過改進模型來應對。Rose認為模型很少是問題，真正的考驗是接下來發生什麼。

使早期升級成為可能的是情感檢測——Rose認為這一能力正在積極改進且未被充分利用。AI系統越來越能夠在客戶明確要求人工之前感知到客戶的挫敗感。及早採取行動的訊號是將一個恢復的互動與一個惡化的互動區分開來的關鍵。大多數企業尚未建立工作流觸發器來利用它。

每個客戶體驗領導者必須能夠回答的升級設計問題：

系統是否足夠早地檢測到挫敗感，以防止在客戶要求之前升級？
客戶的上下文——歷史、情感、先前輸入——有多完整地傳遞給代理？
代理是知情開始，還是客戶需要重複自己？
人工代理是否接受了接收傳輸上下文的培訓，還是重新開始對話？

最後一點是大多數實施默默失敗的地方。技術可以傳遞上下文。代理的行為往往不使用它。這是一個培訓和變更管理問題，不是技術問題——而且完全在企業控制範圍內。

COPC Inc.發現，當AI未能解決問題時，淨推薦值可能下降多達70點——並確定機器人到人工的轉移是所有研究市場中一致的失敗點。模型不是變數，交接才是。Rose的經驗法則：不要根據模型工作時的表現來衡量AI成熟度，而是根據系統在失敗時恢復的乾淨程度。