当数据曝光导致AI部署紧急暂停——以及如何应对
AI可以提高生产力,但也可能暴露长期隐藏的数据,导致安全和治理挑战。来自富达投资和安永的技术领导者分享了他们暂停AI部署以重新评估数据管理的经验,强调了数据所有权、标签和代理身份的必要性。
文章情报
要点
- AI部署可能因数据曝光问题而暂停。
- 富达和安永面临非结构化数据通过AI浮现的挑战。
- 解决方案涉及数据治理、标签和元数据管理。
- 代理身份是数字领导者面临的新难题。
为什么重要
这条新闻值得关注,因为AI部署可能因数据曝光问题而暂停。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
AI的代理和生成式能力为企业专业人士打开了信息和洞察的大门,然而,这种趋势可能过度了。最近的一次会议上,企业AI部署的资深人士向考虑全面投入AI的专业人士发出了警告。这些专业人士遇到的问题甚至导致旨在提高员工生产力的AI部署暂时停止,因为高管们重新评估了可能内部暴露的信息。同时,在纽约市举行的Veeam会议小组讨论中,高管们强调AI并非挑战的根源。两家小组成员的组织都积累了海量数据,其中一家需要新的治理结构。
富达投资高级副总裁史蒂夫·麦金泰尔描述称,他所在拥有40万名员工的公司发现,长期隐藏在组织角落的数据——例如在SharePoint网站或网络附加存储中——突然通过AI提示浮现出来。麦金泰尔说:“这不是AI问题,而是AI快速查找东西的生产力和能力的问题。”安永(EY)企业技术首席架构师维姆·格尔登则描述了他们公司的挑战:在全球独立附属公司网络中确定数据所有权,这些数据也通过其AI引擎浮现。格尔登说:“当大型企业搜索启动时,各种东西开始出现在人们访问的地方。”他补充说,EY Global不拥有任何数据,每个成员公司拥有自己的数据,这引发了第一个问题。他们拥有数PB的数据,就像“狂野西部”,没有生命周期管理,一半的站点没有所有者。
在富达,信息从大量的PowerPoint和PDF报告中浮现出来。麦金泰尔说:“我们有几十年的研究笔记,例如PDF。我们发放了几个Copilot许可证,两天后法务就来说我们有了AI问题。一名团队成员搜索时,AI找回了多年前SharePoint上的所有PowerPoint。”麦金泰尔继续指出,AI是一个“极快的搜索引擎”,突然搜索了所有它能访问的内容,并以有意义的方式呈现出来。大家都以为这是AI问题,但实际上暴露的是数据安全问题。当意识到所有以前不关心的非结构化数据突然变成黄金时,问题就凸显了。
建立防护栏:在安永,当庞大数据库的大门向AI打开时,优先任务是“找到数据的所有者”,格尔登说。第二步是关闭所有权限,只有获得许可的用户才能访问Copilot工具。数据所有权验证过程包括识别和标记整个安永企业中发现的数据,例如“机密”或“金融服务”标签。AI本身也帮助标记非结构化数据的知识库,但由于每年25%的人员流动率,人工标记面临挑战。然而,标签需要比简单的高级标签更深入。格尔登说,首先要知道AI运行时数据的存在,需要历史图像和版本。其次,需要超越机密信息的标签,包括地理限制、地理标签、业务线标签,并与合同关联,因为公司处理大量客户数据,指定了可以使用和不能使用的内容。所有这些元数据必须编入合同,然后编入技术结构,但这仍然非常繁琐。
治理是AI实施成功的关键。麦金泰尔说,必须知道什么正在被使用,这涉及影子AI和影子IT等问题,并追溯到终端数据。资产清单必须准确,并与注册批准的用例对齐。接下来,要考虑代理运行的安全环境,以及如何与基础模型交互,建立合适的架构以提供可见性和遥测,确保代理按预期行为。此外,最棘手的问题之一是建立代理身份。麦金泰尔说:“如何赋予代理身份?它们成为了员工。但如果我的代理只活几秒钟呢?这是一个非常有趣的问题,我不知道是否有人已经很好地解决了。”