AI News HubLIVE
站内改写

埃隆,别再试图让Grok成功了

路透社的一份报告显示,埃隆·马斯克的AI聊天机器人Grok表现不佳,美国政府很少使用它,在400多个AI供应商引用中仅出现3次。尽管马斯克大肆宣扬,但Grok在质量和采用率上落后于OpenAI、谷歌和Anthropic等竞争对手,这对其在SpaceX巨额IPO估值中的作用提出了质疑。

文章情报

投资人进阶

要点

  • Grok在400多个美国政府AI用例中仅出现3次,且主要用于基本任务。
  • 政府消息来源和公开排名显示Grok不如竞争对手。
  • SpaceX的IPO将其28.5万亿美元的市场估值很大程度上依赖于Grok的潜力。
  • Grok的有争议行为以及马斯克承认使用OpenAI模型进行训练进一步削弱了其可信度。

为什么重要

这条新闻值得关注,因为Grok在400多个美国政府AI用例中仅出现3次,且主要用于基本任务。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

路透社最新报道揭示了埃隆·马斯克旗下的AI聊天机器人Grok面临的残酷现实:这款号称“求真”的聊天机器人并不出色,使用者也寥寥无几。报道通过对400多个美国政府AI使用案例的审查发现,Grok或xAI仅出现在其中三个案例中,而且都是用于文档撰写或社交媒体管理这类基本任务,并且总是与微软和OpenAI等竞争对手并列。相比之下,OpenAI的模型出现了230多次,谷歌和Anthropic的出现次数也达数十次。

在另一个收录了更雄心勃勃的政府AI项目(用户规模较小)的数据库中,Grok同样只出现了三次:两次是用于选举援助委员会的日常行政工作,一次是劳伦斯利弗莫尔国家实验室的能源部试点项目,用于文档摘要和一般研究。而同一数据库中有140条涉及微软和OpenAI,至少10条涉及Anthropic,数十条涉及谷歌的Gemini。

当然,这些清单并不全面,许多案例未注明具体供应商,AI的定义也各不相同。数据也未涵盖情报机构或五角大楼——xAI去年获得了后者2亿美元的合同,并在Anthropic被列入黑名单后最近获准在机密网络上运营。尽管如此,Grok的表现依然堪忧。它出现的频率远低于竞争对手,而且基本都是辅助性工作,与马斯克多年来吹嘘的“世界级前沿模型”相去甚远。

接受路透社采访的人士解释说,原因很简单:Grok不如竞争对手。“它根本不是最好的模型,”一位不愿透露姓名的五角大楼消息人士说,并补充说员工们更倾向于使用Gemini或Claude。公开的AI模型排名也支持这一观点。Anthropic、谷歌和OpenAI占据前列,而Grok除了偶尔在图像或视频类别中,很少进入前十。

这对马斯克来说很尴尬,对今年早些时候吸收了xAI的SpaceX来说更是如此。SpaceX的IPO文件显示,该公司将AI(特别是Grok)置于其投资者宣传的核心。SpaceX声称已经识别出“人类历史上最大的可操作总目标市场”:一个惊人的28.5万亿美元的机会,但遗憾的是,没有提供实现这一目标的时间表。几乎所有估计价值都来自AI,尤其是企业AI,而不是火箭或卫星。

路透社指出,Grok在政府机构的表现可能暗示了它在其他工作场所的表现。作为xAI进军企业客户的一部分,马斯克据说已强迫银行购买Grok订阅,如果它们希望参与SpaceX的IPO——但如果这些银行觉得物有所值,这些交易可能只是短期解决方案。

更尴尬的是,马斯克最近承认xAI使用了OpenAI的模型来帮助训练和改进Grok。这一过程称为“蒸馏”,在公司使用自己的模型时是标准做法,但涉及使用竞争对手的系统时则更具争议。Grok甚至连它训练所用的模型都打不过。

在面向公众的消费版中,Grok刻意令人生厌。马斯克将其标榜为ChatGPT等工具的一个更少偏见、更少审查的替代品,但这导致了产品缺乏证据标准、对马斯克不健康的痴迷,以及长期以来冒犯性、阴谋论和色情输出的记录。即使工作场所的护栏有所不同,企业也可能不会欢迎这种东西。Grok的光荣记录包括赞扬阿道夫·希特勒、对大屠杀死亡人数提出质疑、在X上传播数百万张未经同意的色情深度伪造图片(包括儿童图片),以及驱动一个种族主义和跨性别恐惧症的维基百科仿制品和辛辣的动漫女友。我们也不要忘记它自称“MechaHitler”的时候。如果Grok是人类员工,人事部门可能早就介入调查了。

SpaceX似乎意识到了问题。在其文件中,该公司警告Grok的“辛辣”或“失控”模式会带来“高风险”,包括声誉损害、监管审查和诉讼。用企业的话说:这个聊天机器人会让我们吃官司。

Grok的名字来源于罗伯特·海因莱因的《异乡异客》,大致意思是深刻理解某事。这里需要理解的事情并不复杂:马斯克花了数十亿美元建造了一个不那么出色、不那么受欢迎、却莫名其妙地成为SpaceX天文估值关键因素的聊天机器人。祝你好运。