WebDev Arena上只有一款頂尖AI編程模型非中國產
WebDev Arena排行榜顯示,在排名前18的AI web開發模型中,只有Anthropic的Claude Fable 5不是來自中國公司。該排名基於超過42.2萬次投票。
在最新的WebDev Arena排行榜中,中國AI模型在web開發領域展現出壓倒性優勢。前18名中,僅有Anthropic的Claude Fable 5是非中國公司開發的模型,並且它以1653分高居榜首。該排行榜基於超過42.2萬次投票,評估了18家實驗室的模型在包括多步推理和工具使用的代理編碼工作流中的表現。
緊隨其後的是Z.ai的glm-5.2(1584分),字節跳動的seed-2.1-pro-preview(1539分),阿里巴巴的qwen3.7-max(1526分)和月之暗面的kimi-k2.6(1514分)。排名第六的Google Gemini 3.5 Flash(1510分)是第二個非中國模型,但隨後MiniMax、OpenAI、小米、深度求索等中國實驗室的產品牢牢佔據前十。
值得注意的是,OpenAI的最新模型gpt-5.5-xhigh僅排第八,得分1501,而xAI的grok-4.20-beta排名第11。Mistral、IBM等西方實驗室的模型排名靠後。這一結果凸顯了中國在AI編程工具領域的快速進步,尤其是在前端開發方面。
排行榜還包含來自KwaiKAT、Arcee AI和Inception AI等實驗室的模型,展示了多元化的競爭格局。所有模型均在代理編碼工作流中接受評估,這些工作流需要多步推理和工具使用,模擬真實的前端開發任務。