AI News HubLIVE
站内改写6 分で読了

顧客の信頼を失わずにAI駆動のカスタマーサービスを拡大する

AIはカスタマーサービスのコストを削減していますが、組織のリスクを加速させる可能性もあります。スタンフォード大学の研究では、汎用AIチャットボットの法的クエリに対する幻覚率は58%から82%に及ぶことが示されています。AIが問題を解決できない場合、ブランドのネットプロモータースコアは最大70ポイント低下する可能性があります。本記事では、生成AIをカスタマーサービスに展開する際に組織の準備態勢を維持する方法について、信頼の閾値、決定論的AI基盤、エスカレーションデザインなどの重要な洞察を探ります。

ソースEmerj AI Research著者: Marilie Fouche

AIはカスタマーサービスのコストを削減していますが、組織のリスクをさらに加速させる可能性があります。経営幹部の本当の問題はAIを導入するかどうかではなく、企業が顧客の前でAIが失敗した瞬間に耐えられる準備態勢を構築しているかどうかです。スタンフォード大学のRegLabは、汎用AIチャットボットが法的なクエリに対して58%から82%の確率で幻覚を起こすことを文書化しており、専用の法的AIツールでさえ、ベンチマークケースの少なくとも6件に1件は幻覚を起こします。スタンフォードHAI 2026 AIインデックスによると、26の主要モデルの幻覚率は22%から94%の範囲にあり、2025年の文書化されたAIインシデントは362件に達し、前年の233件から増加しました。

消費者金融保護局(CFPB)は、カスタマーサービスチャットボットが失敗すると、顧客の信頼を損なうだけでなく、広範囲にわたる害を引き起こす可能性があり、設計の悪いチャットボット技術により消費者が誤った製品を選択したり、手数料を誤解したり、紛争処理へのアクセスを失ったりした場合、金融機関は積極的な法的責任を負うリスクがあると警告しています。連邦取引委員会(FTC)と他の3つの連邦機関は、2023年12月に、消費者に有害な結果をもたらすAIツールに対して既存の法律を積極的に執行することを共同で誓約しました。

独立したカスタマーオペレーション基準機関であるCOPC Inc.が6カ国で1,000人以上の消費者を対象に行ったグローバル調査では、AIが顧客の問題を追加の手順なしに完全に解決した場合、満足度は90%以上に上昇するが、AIが問題を解決できなかった場合、ブランドのネットプロモータースコアは最大70ポイント低下する可能性があることが判明しました。同じ研究では、AIから人間のエージェントへのハンドオフが、調査したすべての市場で最も一貫した失敗点であることが特定されました。問題はAIモデル自体ではなく、その背後にあるワークフローデザインです。

Adobeのカスタマーエクスペリエンス担当シニアディレクターであるRobert Rose氏は、EmerjのAI in BusinessポッドキャストでMatthew DeMello氏とともに、カスタマーサービスにおけるAIの成熟曲線をマッピングし、企業がこれらの機能を安全に顧客に拡大する前に正しく行わなければならないことを概説しました。この記事では、AdobeのRobert Rose氏の洞察から、企業が組織の準備態勢を超えることなくカスタマーサービスに生成AIを展開する方法に関する3つの重要なポイントを考察します。

信頼の閾値を展開マップとして:顧客がAIを受け入れる意欲はインタラクションのリスクに反比例し、展開の順序はその現実を反映しなければなりません。人々は何年も気づかずにAIシステムとやり取りしてきましたが、リスクの低い状況ではほとんど摩擦が生じません。しかし、結果が重要になる瞬間——請求の紛争、財務上の決定、医療上の懸念——には信頼が強まり、許容範囲が狭まります。これにより自然な展開マップが作成されます。一部のインタラクションは自動化の準備ができています。他のものは監督が必要です。信頼が得られるまで人間主導でなければならないものもあります。順序はテクノロジーができることではなく、顧客が許容する意思によって決まります。Rose氏は、この曲線は動いているが、企業のスケジュールに従っているわけではないと強調します。顧客が信頼の拡大を決定し、その曲線より先に展開するとフラストレーションと顧客離れを招きます。

この信頼の問題に埋め込まれているのは、ほとんどの企業が今静かに下している戦略的決断、すなわち顧客がAIと話していることを開示するかどうかです。Rose氏はこれを倫理的な問題ではなく、ブランドと運用上の問題として捉えています:「企業は実際に、それがボットであることを言わないことを検討しており、単にこれとやり取りさせて、うまくいっていないと感じるまで続け、その後人間に送る、と言っています。私たちはあなたに伝えません——しかし、それは本当に会社次第です。」

上級リーダーへの影響は直接的です。開示の決定はもはやデフォルトではなく、両方向に結果がある選択です。AIを開示することで期待値が設定され、システムが失敗したときにブランドを保護します。開示しないことは、顧客が単にサービスが悪いと感じるだけでなく、誤解されたと感じるため、すべての失敗の代償を高めます。経営幹部は、ベンダーの実装から受け継いだものではなく、この点について意図的な立場を持つ必要があります。

Roseのフレームワークに従った展開のセグメンテーション:

  • 低リスクの取引インタラクション:AIは今すぐ自律的に運用可能
  • 中リスクのインタラクション:AIと人間の監督の組み合わせが現在の標準
  • 高リスクの規制対象インタラクション:信頼が確立されるまで、人間主導でAIは補助的な役割

生成的なパーソナライゼーションの前提条件としての決定論的AI基盤:Rose氏は、ほとんどの企業のAIロードマップが見逃している区別を描いています。予測AIと生成AIは交換可能ではなく、順次的です。予測システムはルールとパターンに従い、生成システムは応答を生成します。その下に信頼できる決定論的層がなければ、それらの応答には裏付けがありません。

これによって生じるガバナンスの変化は重要です。予測AIの時代には、企業はボットをプログラムしました——この質問が来たら、こう答える、と。生成AIはその制約を完全に取り除きます。システムはアクセスできるデータに基づいて何を言うかを決定します。ここで能力が拡大し、リスクが入り込みます。

彼は失敗モードを直接説明します:「それらはでっち上げます。実際にはでっち上げているわけではありません——どこかで見つけてきただけです。そしてそれを誤解し、推奨し、適切な文脈ではありませんでした。」

生成AIがすでに価値を提供している分野——人間の監督下であっても——は応答のパーソナライゼーションです。Adobeのエグゼクティブは、現在利用可能で適切な監督モデルで今すぐ導入できる機能について説明します:「プロファイル、最近のインタラクションに基づいて応答をパーソナライズできます——この顧客は普段から怒っているのか、それとも今怒っているのか?もしそうなら、落ち着かせる言葉を入れます。生成AIは今日ですべてそれを行うことができます。」

この機能——リアルタイムの感情認識に基づく応答生成——は、カスタマーサービスにおける生成AIの短期的な価値のケースです。しかしRose氏は、これには大人の監督が必要であると明言しています。彼が責任を負わずにその価値を獲得したい組織に推奨する道筋:「これらの企業がおそらくすべき最善のことは、社内で実験し、人間の目でそれを見て『おや、それは本当に良い』と言わせ、得られたものを調整してから顧客に届けることです。」

Rose氏が上級リーダーにほのめかしている順序チェックリスト:

  • 予測AIが組織が擁護できる出力を生成している
  • 顧客データが構造化され安定しており、生成モデルが正確に引き出せる
  • 内部の生成出力が顧客接触前にレビューされている
  • 法務およびリスクチームが展開プロセスに組み込まれており、完成したシステムを渡されることはない

法務が抵抗する場合、Rose氏はそれを決定論的基盤がまだ大規模な生成パーソナライゼーションをサポートするほど強固ではないというシグナルとして扱います。その抵抗は診断的であり、妨害的ではありません。

サービスAI成熟度の尺度としてのエスカレーションデザイン:Rose氏は、カスタマーサービスAIにおける最も誤読されやすいシグナルの1つを再定義します。顧客が「オペレーター、オペレーター」と繰り返すとき、失敗はモデルではなくワークフローです。システムがフラストレーションを十分早く検出できなかったか、顧客に最初からやり直しを強いる方法で引き継ぎを行ったかのいずれかです。ほとんどの組織はモデルを改善することで対応します。Rose氏は、モデルが問題であることはほとんどなく、本当の試練は次に何が起こるかであると主張します。

早期のエスカレーションを可能にするのは感情検出です——Rose氏はこの機能が積極的に改善されており、過小活用されていると特定しています。AIシステムは、顧客が明示的に人間を要求する前に顧客のフラストレーションを感知できるようになりつつあります。そのシグナルに早期に行動することが、回復するインタラクションと悪化するインタラクションを分けるものです。ほとんどの企業は、それを活用するワークフロートリガーをまだ構築していません。

すべてのCXリーダーが答えられなければならないエスカレーションデザインの質問:

  • システムは、顧客が要求する前にエスカレーションを防ぐのに十分早くフラストレーションを検出しますか?
  • 顧客のコンテキスト——履歴、感情、以前の入力——はどの程度完全にエージェントに引き継がれますか?
  • エージェントは情報を得て開始しますか、それとも顧客が繰り返さなければなりませんか?
  • 人間のエージェントは引き継がれたコンテキストを使用するように訓練されていますか、それとも会話を再開しますか?

最後のポイントは、ほとんどの実装が静かに失敗する場所です。テクノロジーはコンテキストを引き継ぐことができます。エージェントの行動はそれを使用しないことがよくあります。これはトレーニングと変更管理の問題であり、テクノロジーの問題ではなく、完全に企業の管理下にあります。

COPC Inc.は、AIが問題を解決できない場合、ネットプロモータースコアが最大70ポイント低下する可能性があることを発見し、ボットから人間への転送が調査したすべての市場で最も一貫した失敗点であると特定しました。モデルは変数ではなく、ハンドオフが問題でした。Rose氏の経験則:AIの成熟度を、モデルが機能したときの成果ではなく、機能しなかったときにシステムがどれだけきれいに回復するかで測定することです。