AI News HubLIVE
站内改写

當數據曝光導致AI部署緊急暫停——以及如何應對

AI可以提高生產力,但也可能暴露長期隱藏的數據,導致安全和治理挑戰。來自富達投資和安永的技術領導者分享了他們暫停AI部署以重新評估數據管理的經驗,強調了數據所有權、標籤和代理身份的必要性。

文章情報

投資人中級

要點

  • AI部署可能因數據曝光問題而暫停。
  • 富達和安永面臨非結構化數據通過AI浮現的挑戰。
  • 解決方案涉及數據治理、標籤和元數據管理。
  • 代理身份是數字領導者面臨的新難題。

為甚麼重要

這條新聞值得關注,因為AI部署可能因數據曝光問題而暫停。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

AI的代理和生成式能力為企業專業人士打開了信息和洞察的大門,然而,這種趨勢可能過度了。最近的一次會議上,企業AI部署的資深人士向考慮全面投入AI的專業人士發出了警告。這些專業人士遇到的問題甚至導致旨在提高員工生產力的AI部署暫時停止,因為高管們重新評估了可能內部暴露的信息。同時,在紐約市舉行的Veeam會議小組討論中,高管們強調AI並非挑戰的根源。兩家小組成員的組織都積累了海量數據,其中一家需要新的治理結構。

富達投資高級副總裁史蒂夫·麥金泰爾描述稱,他所在擁有40萬名員工的公司發現,長期隱藏在組織角落的數據——例如在SharePoint網站或網絡附加存儲中——突然通過AI提示浮現出來。麥金泰爾説:“這不是AI問題,而是AI快速查找東西的生產力和能力的問題。”安永(EY)企業技術首席架構師維姆·格爾登則描述了他們公司的挑戰:在全球獨立附屬公司網絡中確定數據所有權,這些數據也通過其AI引擎浮現。格爾登説:“當大型企業搜索啓動時,各種東西開始出現在人們訪問的地方。”他補充説,EY Global不擁有任何數據,每個成員公司擁有自己的數據,這引發了第一個問題。他們擁有數PB的數據,就像“狂野西部”,沒有生命週期管理,一半的站點沒有所有者。

在富達,信息從大量的PowerPoint和PDF報告中浮現出來。麥金泰爾説:“我們有幾十年的研究筆記,例如PDF。我們發放了幾個Copilot許可證,兩天後法務就來説我們有了AI問題。一名團隊成員搜索時,AI找回了多年前SharePoint上的所有PowerPoint。”麥金泰爾繼續指出,AI是一個“極快的搜索引擎”,突然搜索了所有它能訪問的內容,並以有意義的方式呈現出來。大家都以為這是AI問題,但實際上暴露的是數據安全問題。當意識到所有以前不關心的非結構化數據突然變成黃金時,問題就凸顯了。

建立防護欄:在安永,當龐大數據庫的大門向AI打開時,優先任務是“找到數據的所有者”,格爾登説。第二步是關閉所有權限,只有獲得許可的用户才能訪問Copilot工具。數據所有權驗證過程包括識別和標記整個安永企業中發現的數據,例如“機密”或“金融服務”標籤。AI本身也幫助標記非結構化數據的知識庫,但由於每年25%的人員流動率,人工標記面臨挑戰。然而,標籤需要比簡單的高級標籤更深入。格爾登説,首先要知道AI運行時數據的存在,需要歷史圖像和版本。其次,需要超越機密信息的標籤,包括地理限制、地理標籤、業務線標籤,並與合同關聯,因為公司處理大量客户數據,指定了可以使用和不能使用的內容。所有這些元數據必須編入合同,然後編入技術結構,但這仍然非常繁瑣。

治理是AI實施成功的關鍵。麥金泰爾説,必須知道什麼正在被使用,這涉及影子AI和影子IT等問題,並追溯到終端數據。資產清單必須準確,並與註冊批准的用例對齊。接下來,要考慮代理運行的安全環境,以及如何與基礎模型交互,建立合適的架構以提供可見性和遙測,確保代理按預期行為。此外,最棘手的問題之一是建立代理身份。麥金泰爾説:“如何賦予代理身份?它們成為了員工。但如果我的代理只活幾秒鐘呢?這是一個非常有趣的問題,我不知道是否有人已經很好地解決了。”