Mistral AI Now峰会巴黎见闻
本文分享了作者在巴黎Mistral AI Now峰会上的个人见解。Mistral不再只是一家模型公司,而是构建了包含计算、模型、平台和咨询服务的完整AI堆栈。峰会重点强调了与ASML、BNP Paribas、亚马逊等企业的合作,而非新模型发布。Mistral专注于高效、开放和可定制的模型,并支持本地部署,这成为其区别于Anthropic或OpenAI的独特卖点。小型专用模型是关键战略,例如用于OCR的Document AI、多语言语音的Voxtral和工业机器人的Robostral。主权和本地部署是欧洲企业的差异化优势,如BNP Paribas和Abanca的案例。此外,奥地利科学院利用Mistral的编程模型Codestral解读古代纸莎草文献,展示了AI在人文领域的潜力。总而言之,Mistral的目标并非赢得AGI竞赛,而是成为欧洲的全栈AI合作伙伴,提供即时的实际投资回报。
文章情报
要点
- Mistral正从模型公司转型为全栈AI提供商,拥有自家计算、模型、平台和咨询业务。
- 峰会注重合作伙伴关系(ASML、BNP Paribas、亚马逊),而非发布新模型。
- 专用小模型(如Document AI、Voxtral、Robostral)在特定任务上优于大型通用模型。
- 主权和本地部署是Mistral对欧洲受监管企业的关键差异化优势。
为什么重要
这条新闻值得关注,因为Mistral正从模型公司转型为全栈AI提供商,拥有自家计算、模型、平台和咨询业务。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
最近,我前往巴黎参加了Mistral AI举办的Now峰会,希望深入了解其模型、欧洲AI的未来规划等。以下是我的个人观察。
Mistral已不再仅仅是一家模型公司。他们正在构建完整的AI堆栈:计算、模型、平台和咨询。他们拥有自己的计算资源——一个位于巴黎的40兆瓦数据中心,并且更多数据中心正在建设中,包括在瑞典的一个。他们的核心重点是高效、开源且可定制的模型,这些模型归用户所有,并可运行在本地。相较于Anthropic或OpenAI,这似乎是他们独特的卖点。
峰会的主题信息主要集中在合作伙伴关系上:与ASML、BNP Paribas、亚马逊的Alexa+等合作,以及他们如何利用AI解决实际问题。关于新模型和技术创新的消息较少,这让我有些失望。不过,他们确实推出了Vibe for Work,一个类似于Claude for Work的产品。
关于智能体(agentic)方面,Pieter Stock在演讲中提到,模型本身是不够的,还需要一个“框架”(harness)来添加上下文、持久性和学习能力。推理能力至关重要,能让系统回溯、从错误中恢复并保持透明。技能是组织捕获最佳实践的方式,需要与AI代理合作开发。
专用小模型是Mistral战略的关键。他们展示了多个例子,表明在能效和速度方面,小型、快速且专注的模型优于大型通用模型:Document AI用于OCR(已被欧盟专利局用于大规模OCR),Voxtral用于多语言语音(为亚马逊Alexa+在欧洲提供支持),以及Robostral用于与ASML合作的工业机器人。在令牌密集的智能体应用中,速度和效率正变得与原始能力同等重要。
主权和本地部署是他们的差异化优势。BNP Paribas在比利时本地部署Mistral模型进行KYC,敏感数据保留在银行内部。Abanca利用智能体编排处理大量敏感客户信息(其应用拥有200万客户)。对于欧洲受监管行业的企业来说,这是依赖美国超大规模云服务商的一个良好替代方案。
一个特别且令我非常享受的演讲是关于古代纸莎草文献的:奥地利科学院的一个研究团队微调了Mistral的编程模型Codestral,用于阅读数千年前被丢弃的纸莎草碎片,这些碎片几十年来一直未被出版。这项工作有助于使在埃及沙漠中发现的18万份文献变得可访问,如果没有AI,这将需要超过2000年。这是一个绝佳的例子,展示了AI如何也能帮助人文学科。
总的来说,这次峰会让我更清楚地看到了Mistral对欧洲AI的愿景:也许不是赢得通用人工智能(AGI)竞赛,而是成为欧洲的全栈AI合作伙伴,现在就能提供实际的投资回报。这一愿景能否成功,取决于更多欧洲公司是否致力于此,但开源模型、本地部署和企业合作伙伴关系的结合,可能对欧盟的许多大型组织具有吸引力。而且,说实话,看到一位认真的欧洲玩家出现在谈判桌上很好。盲目依赖美国科技巨头的日子即将结束。