2026-05-28 22:16 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

当数据曝光导致AI部署紧急暂停——以及如何应对

AI可以提高生产力，但也可能暴露长期隐藏的数据，导致安全和治理挑战。来自富达投资和安永的技术领导者分享了他们暂停AI部署以重新评估数据管理的经验，强调了数据所有权、标签和代理身份的必要性。

AI的代理和生成式能力为企业专业人士打开了信息和洞察的大门，然而，这种趋势可能过度了。最近的一次会议上，企业AI部署的资深人士向考虑全面投入AI的专业人士发出了警告。这些专业人士遇到的问题甚至导致旨在提高员工生产力的AI部署暂时停止，因为高管们重新评估了可能内部暴露的信息。同时，在纽约市举行的Veeam会议小组讨论中，高管们强调AI并非挑战的根源。两家小组成员的组织都积累了海量数据，其中一家需要新的治理结构。

富达投资高级副总裁史蒂夫·麦金泰尔描述称，他所在拥有40万名员工的公司发现，长期隐藏在组织角落的数据——例如在SharePoint网站或网络附加存储中——突然通过AI提示浮现出来。麦金泰尔说：“这不是AI问题，而是AI快速查找东西的生产力和能力的问题。”安永（EY）企业技术首席架构师维姆·格尔登则描述了他们公司的挑战：在全球独立附属公司网络中确定数据所有权，这些数据也通过其AI引擎浮现。格尔登说：“当大型企业搜索启动时，各种东西开始出现在人们访问的地方。”他补充说，EY Global不拥有任何数据，每个成员公司拥有自己的数据，这引发了第一个问题。他们拥有数PB的数据，就像“狂野西部”，没有生命周期管理，一半的站点没有所有者。

在富达，信息从大量的PowerPoint和PDF报告中浮现出来。麦金泰尔说：“我们有几十年的研究笔记，例如PDF。我们发放了几个Copilot许可证，两天后法务就来说我们有了AI问题。一名团队成员搜索时，AI找回了多年前SharePoint上的所有PowerPoint。”麦金泰尔继续指出，AI是一个“极快的搜索引擎”，突然搜索了所有它能访问的内容，并以有意义的方式呈现出来。大家都以为这是AI问题，但实际上暴露的是数据安全问题。当意识到所有以前不关心的非结构化数据突然变成黄金时，问题就凸显了。

建立防护栏：在安永，当庞大数据库的大门向AI打开时，优先任务是“找到数据的所有者”，格尔登说。第二步是关闭所有权限，只有获得许可的用户才能访问Copilot工具。数据所有权验证过程包括识别和标记整个安永企业中发现的数据，例如“机密”或“金融服务”标签。AI本身也帮助标记非结构化数据的知识库，但由于每年25%的人员流动率，人工标记面临挑战。然而，标签需要比简单的高级标签更深入。格尔登说，首先要知道AI运行时数据的存在，需要历史图像和版本。其次，需要超越机密信息的标签，包括地理限制、地理标签、业务线标签，并与合同关联，因为公司处理大量客户数据，指定了可以使用和不能使用的内容。所有这些元数据必须编入合同，然后编入技术结构，但这仍然非常繁琐。

治理是AI实施成功的关键。麦金泰尔说，必须知道什么正在被使用，这涉及影子AI和影子IT等问题，并追溯到终端数据。资产清单必须准确，并与注册批准的用例对齐。接下来，要考虑代理运行的安全环境，以及如何与基础模型交互，建立合适的架构以提供可见性和遥测，确保代理按预期行为。此外，最棘手的问题之一是建立代理身份。麦金泰尔说：“如何赋予代理身份？它们成为了员工。但如果我的代理只活几秒钟呢？这是一个非常有趣的问题，我不知道是否有人已经很好地解决了。”