AI News HubLIVE
站内改写1 分钟阅读

WebDev Arena上只有一款顶尖AI编程模型非中国产

WebDev Arena排行榜显示,在排名前18的AI web开发模型中,只有Anthropic的Claude Fable 5不是来自中国公司。该排名基于超过42.2万次投票。

来源Hacker News AI作者: SweetSoftPillow

在最新的WebDev Arena排行榜中,中国AI模型在web开发领域展现出压倒性优势。前18名中,仅有Anthropic的Claude Fable 5是非中国公司开发的模型,并且它以1653分高居榜首。该排行榜基于超过42.2万次投票,评估了18家实验室的模型在包括多步推理和工具使用的代理编码工作流中的表现。

紧随其后的是Z.ai的glm-5.2(1584分),字节跳动的seed-2.1-pro-preview(1539分),阿里巴巴的qwen3.7-max(1526分)和月之暗面的kimi-k2.6(1514分)。排名第六的Google Gemini 3.5 Flash(1510分)是第二个非中国模型,但随后MiniMax、OpenAI、小米、深度求索等中国实验室的产品牢牢占据前十。

值得注意的是,OpenAI的最新模型gpt-5.5-xhigh仅排第八,得分1501,而xAI的grok-4.20-beta排名第11。Mistral、IBM等西方实验室的模型排名靠后。这一结果凸显了中国在AI编程工具领域的快速进步,尤其是在前端开发方面。

排行榜还包含来自KwaiKAT、Arcee AI和Inception AI等实验室的模型,展示了多元化的竞争格局。所有模型均在代理编码工作流中接受评估,这些工作流需要多步推理和工具使用,模拟真实的前端开发任务。