AI News HubLIVE
站内改写3 分钟阅读

穿越生成式AI的噪音

自2022年底ChatGPT发布以来,生成式AI引发了巨大兴趣和炒作。企业纷纷制定GenAI战略,但实际能力与期望之间存在差距。IDC调查显示,近80%的高管有信心在未来利用GenAI,但只有30%的企业目前准备就绪。文章探讨了企业采用GenAI的路径,包括自建模型与购买API的抉择,以及治理、透明度和数据架构等关键问题。

来源Datanami AI作者: Alex Woodie

自2022年底ChatGPT发布以来,生成式AI(GenAI)技术迅速成为科技界和商业界的焦点。这一浪潮既带来了巨大的创新潜力,也伴随着大量的炒作和不确定性。对于刚刚开始规划GenAI战略的企业而言,如何从喧嚣中认清本质,并找到将这项技术融入自身运营的有效途径,成为当务之急。

目前,业界对GenAI的认知度已达到前所未有的高度。Databricks首席执行官Ali Ghodsi在最近的数据与AI峰会上表示:“在过去六到七个月里,我与客户的每一次会议最终都会转向生成式AI。无论最初讨论的是什么话题,最后的落脚点总是生成式AI。”IDC的调查数据也印证了这一观点。由Teradata赞助的一项IDC调查显示,近80%的高管相信,他们的公司将在未来的产品或运营中利用GenAI。IDC分析师Chandana Gopal和Dan Vesset在调查预览中写道:“没有其他技术能在不到一年的时间内取得GenAI这样的成就——它激发了数百万人的想象力,颠覆了人类创造内容的方式,并从根本上改变了人们思考和工作的模式。”

然而,企业利用GenAI的意愿与实际能力之间存在显著差距。同一项针对900名全球高管的调查发现,目前只有30%的受访者认为自己的企业已充分准备好利用GenAI,预计这一数字在未来6至12个月内只会温和增长至42%。与此同时,56%的高管表示,他们在未来6至12个月内面临着“高”或“显著”的压力,需要尽快部署GenAI,以免在竞争中落后。

那么,企业究竟应如何采用GenAI?即将在华盛顿特区举行的VOICE+AI会议的组织者Pete Erickson指出:“今年每个人都在问:现在什么是可能的?我应该如何评估?这是一个非常独特的年份。几年后,一切会变得更加正常化,人们将看到确定的结果。”对于已经投资于先进自然语言处理和大型语言模型的联络中心行业来说,GenAI的路径相对清晰。但其他行业应如何适应?

企业必须解决的最大问题之一是:是自建GenAI系统,还是购买第三方解决方案?通过API,企业可以访问如OpenAI的GPT-4等强大的预训练模型,这些模型在海量数据上训练而成,能够生成文本甚至图像。然而,许多公司不愿采用API方式,担心失去对数据的控制。同时,他们认为GPT-4或Google PaLM等通用模型对于自身特定需求而言过于臃肿。Databricks的Ghodsi表示:“这是当前最核心的问题。很多公司和服务提供的是生成式AI,但并非你自己的模型,因此你无法控制自己的知识产权。”

但自建大型语言模型(GenAI的核心)成本高昂且耗时。据估计,训练OpenAI的GPT-3在Nvidia Tesla V100上花费约460万美元。GPU短缺和技术人才缺口也是重要障碍。这正是Databricks收购MosaicML的动因。MosaicML由Naveen Rao于2021年初共同创立,在Databricks旗下将成为一个定制化GenAI模型的“工厂”,生产比GPT-4小得多、成本也低得多的模型。

除了“购买还是自建”的争论,企业还需要思考GenAI能做什么。IDC集团副总裁Philip Carter指出,GenAI将有三类广泛用例:生产力应用、业务功能应用和行业特定应用。生产力应用涵盖基本场景,如总结报告、生成职位描述或Java代码,这类功能正被融入现有应用(如微软的Copilot或谷歌的Duet AI)。业务功能应用则更针对特定目标,如辅助营销、销售或采购,通常涉及一个或多个GenAI模型的采用,但许多组织担心知识产权泄露和数据治理问题。行业特定应用则需要最深入的工作,例如药物发现或制造材料设计,有些企业会自建模型,而另一些则通过API访问现有模型。

在利用自有数据创建GenAI应用之前,企业还有大量准备工作要做。治理和透明度问题迅速成为焦点。美国计算机协会(ACM)最近发布新论文,呼吁对高风险AI应用加强监管,一位作者将当前形势描述为“狂野西部”。IDC的Carter建议企业投资构建智能架构以管理数据和模型的整个生命周期,并建立数据隐私、安全和知识产权保护的协议。

生成式AI的未来是光明的,尽管围绕ChatGPT的热度可能逐渐消退,但每一项新技术都是通向更强大技术的垫脚石。企业不仅需要为当前的GenAI做好准备,更应积极迎接下一代AI的到来。