データ露呈でAI導入が急停止——その管理方法
AIは生産性を向上させる一方、長年隠されていたデータを露呈させ、セキュリティとガバナンスの課題を引き起こす。フィデリティ・インベストメンツとEYのテクノロジーリーダーが、AI導入を一時停止してデータ管理体制を見直した経験を共有し、データ所有権、ラベリング、エージェントIDの必要性を強調する。
記事インテリジェンス
要点
- AI導入はデータ露呈問題により停止される可能性がある。
- フィデリティとEYは非構造化データがAIで浮上する課題に直面。
- 解決策はデータガバナンス、ラベリング、メタデータ管理。
- エージェントIDはデジタルリーダーにとって新たな難題。
重要な理由
このニュースが重要なのは、AI導入はデータ露呈問題により停止される可能性があるためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
AIのエージェント型・生成型機能は企業の専門家に情報と洞察をもたらしたが、その傾向は過剰になる可能性がある。最近の会議で、企業でのAI導入のベテランたちは、AIに真っ向から取り組もうとする専門家に警告を発した。彼らが直面した問題は、従業員の生産性向上を目的としたAI導入の一時停止にまで至り、経営幹部は内部で露呈する可能性のある情報を再評価した。同時に、Veeamのニューヨーク会議のパネルで発言した幹部たちは、AIが課題の根源ではないと強調した。両パネリストの組織は膨大なデータを蓄積しており、一方は新しいガバナンス構造を必要としていた。
フィデリティ・インベストメンツのシニアバイスプレジデント、スティーブ・マッキンタイア氏は、同社(従業員40万人)がSharePointサイトやネットワーク接続ストレージなど組織の奥深くに長年眠っていたデータが、AIプロンプトを介して突然浮上したと説明した。「それはAIの問題ではなく、AIが素早く物事を見つける生産性と能力の問題だった」と同氏は述べた。EYのエンタープライズテクノロジー担当チーフアーキテクト、ウィム・ゲールデン氏は、独立した関連会社のグローバルネットワーク全体でのデータ所有権の特定が課題であり、そのデータもAIエンジンを通じて浮上していると説明した。「大規模なエンタープライズ検索が開始されると、あらゆる種類のものが人々が訪れる場所に現れ始めた」と同氏は述べた。EYグローバルはデータを所有せず、各メンバーファームがデータを所有しており、最初の疑問が生じた。何が起きているのか?いくつのSharePointサイトがあるのか?複数ペタバイトのデータがあり、西部開拓時代のようだった。ライフサイクル管理はなく、半分のサイトには所有者がいなかった。
フィデリティでは、PowerPointやPDFの膨大なレポートから情報が浮上した。「当社には数十年分の研究ノート(PDFなど)の履歴がある」とマッキンタイア氏は述べた。「Copilotのライセンスをいくつか提供したところ、2日後には法務からAI問題が発生したと言われた。チームメンバーが何かを検索したところ、AIが何年も前のSharePoint上の全PowerPointを返してきたのだ」と同氏は続けた。AIは「高速で動作する驚異的な検索エンジン」であり、アクセス可能なすべてを検索し、有意義な形で提示する。「誰もがAI問題だと思ったが、実際にはデータのセキュリティ問題が明らかになった。私たちが気にしていなかった非構造化データが、LLMの登場で突然黄金の価値を持つようになった」
ガードレールの確立:EYでは、膨大なデータストアの門がAIに開かれると、優先事項は「データの所有者を見つけること」だったとゲールデン氏は述べた。「次にやったことは、すべてをシャットダウンすることだ」。Copilotツールへのアクセスはライセンス保持者のみに制限された。データ所有権の確認プロセスには、EY全体で見つかったデータの識別とラベル付けが含まれ、例えば「機密」や「金融サービス」といったラベルが付けられた。AI自体が非構造化データのナレッジリポジトリのラベル付けを支援したが、年25%の離職率の中で人手によるラベル付けは困難だった。ただし、ラベル付けは単純なハイレベルなタグを超える必要がある。「まず、AIが実行された時に何があったかを知る必要がある」とゲールデン氏は述べ、「履歴とバージョンの把握が必要だ」と続けた。さらに、「機密情報のラベル付けを超え、地理的制限、地理ラベル、事業ラインラベルを契約と連携させる必要がある。膨大な顧客データを扱い、何が可能で何が不可能かが指定されている」。これらのメタデータはすべて契約に組み込まれ、その後技術構造に組み込む必要があるが、現時点では非常に困難である。
ガバナンスはAI実装の全側面で成功の鍵であると幹部たちは強調した。「何が使われているかを把握する必要がある」とマッキンタイア氏は述べ、「シャドーAI、シャドーITといった概念が浮上し、エンドポイントデータに遡る。資産インベントリが正確であり、登録・承認されたユースケースに沿っていることを確認する必要がある。そうすれば、誰かが何かに取り組んでいる場合、承認された特定のプロジェクトに関連してClaudeを使うべきだとわかる」と続けた。次に、「エージェントを実行する安全な環境を考える必要がある。基盤モデルとどのように相互作用させるか?適切な可視性とテレメトリを得るためのアーキテクチャを構築し、AIを使うエージェントやアプリケーションが意図通りに動作しているか、または誤動作しているかを確認する必要がある」。さらに、おそらく現時点で最も厄介な課題は、エージェントIDの確立である。「エージェントにIDを与えるにはどうするか?エージェントは従業員になる。しかし、エージェントが数秒しか生きない場合は?これは非常に興味深い問題であり、まだ誰もうまく解決できていないと思う」とマッキンタイア氏は述べた。