企業AI屢屢失敗的原因,並非模型本身的問題
企業投入數十億美元於AI,但多數未能獲得持續價值。麥肯錫2024年調查顯示,僅不到三分之一的企業報告AI投資產生顯著回報。問題不在於模型或數據,而在於缺乏一個動態、持久的企業上下文層,該層能理解業務、數據含義和規則。文章提出了四個維度:上下文必須自我學習、多維、平台獨立,並對自主代理至關重要。
企業領導者們已經在AI上投入了兩年時間和數千億美元,但結果參差不齊。根據麥肯錫2024年全球調查,只有不到三分之一的公司報告其AI投資產生了有意義且持續的業務價值。演示往往令人印象深刻,而實際生產環境卻令人失望。最常見的診斷是模型不夠好、數據基礎設施不成熟或員工未經過培訓。這種診斷雖然有一定道理,但大多不完整,甚至錯誤。真正的問題在於上下文——具體來説,是缺乏一個位於AI與數據之間的持久、動態的企業上下文層。組織必須理解這一點並據此構建系統,否則模型升級和基礎設施投資將無法彌補這一差距。
上下文差距:每個企業AI系統都需要將人類問題轉化為機器可執行的任務。為此,系統必須瞭解業務、數據含義、指標定義、適用的業務規則及其演變。在大多數企業部署中,這種上下文要麼缺失、不完整,要麼比任何人所跟蹤的衰減得更快。例如,一家全球2000強制造企業部署財務分析AI,系統可以訪問數據倉庫並進行查詢,但能否準確計算跨業務單元的毛利率?這些規則存在於少數資深財務分析師的大腦中、電子表格中、三年老的Slack消息中以及非文檔化的機構記憶裏。當這些分析師換崗或退休時,知識消失,AI系統缺乏上下文,開始生成精確但錯誤的結果。這不是數據質量問題,而是上下文問題。
領導者搞錯的四個維度:一、上下文必須自我學習。最常見的錯誤是將上下文視為一次性實施。組織投入大量精力進行初始上下文捕獲,標記元數據、記錄業務定義、編錄批准查詢,然後將其視為完成品,但上下文永遠不會完成。上下文會持續且通常無形地衰減:模式變更、數據漂移、業務指標重新定義、業務流程重組。如果上下文層依賴人類維護,人類將成為瓶頸並不斷落後。有效的上下文層需要從使用模式、驗證答案和人工修正中持續學習。二、上下文是多維的,無法在一個地方捕獲。企業知識並非存在於單一系統中,而是同時存在於模式、已驗證查詢的邏輯、正式和非正式文檔、語義和元數據層以及人們的隱性知識中。大多數企業犯的錯誤是追求單一上下文源,如元數據目錄或語義層,並期望其承擔全部負擔。但沒有任何單一層能夠做到。有效的上下文層必須跨越所有這些維度,並在每個維度獨立演變時保持連貫。三、上下文層必須在架構上獨立於底層數據平台。如果上下文構建在特定平台內,它會與該平台的專有結構和API糾纏在一起。上下文層是數據組織創建的最有價值的智力資產,它編碼了多年的業務邏輯、驗證查詢和機構知識。當這一資產依賴於平台時,組織就喪失了架構靈活性和談判槓桿。此外,大多數企業的數據分佈在多個平台中:Snowflake、Databricks、Salesforce、SAP以及遺留系統。跨所有這些平台的上下文要求抽象化。四、每個AI代理都繼承了上下文問題,並使其更糟。隨着企業從協作工具和聊天機器人轉向自主代理,這一問題變得緊迫。協作工具有人蔘與循環,分析師可以判斷並糾正錯誤。而自主代理在沒有人類檢查點的情況下運行,自動執行查詢、合成數據、生成報告並觸發下游工作流。如果上下文不準確,代理會將錯誤傳播到多個系統和決策。因此,上下文層質量變得不可妥協。
投資決策框架:高級領導者在評估AI投資時應直接提出四個問題。系統是學習型還是需要手動維護?它捕獲了多少維度的上下文?上下文是否可移植?代理的治理模型是什麼?成功的模式表明,帶來持續價值的組織並非擁有最大的模型或最多的數據,而是投資於一個活的、多維的、平台獨立的上下文層,並將其視為戰略資產而非實施細節。認識到這一點的組織將建立複合優勢,而那些仍將其視為腳註的組織將陷入昂貴的反覆循環:演示令人印象深刻,生產令人失望。
關於作者:Soham Mazumdar是一位連續創業者和技術領導者,現任WisdomAI的聯合創始人兼CEO,該公司提供基於AI的數據洞察平台。此前,他聯合創立了Rubrik並擔任首席架構師,將其發展至IPO。他還聯合創立了Tagtile(被Facebook收購),並領導了谷歌的核心搜索基礎設施。