Kimi K2.7 Code vs Claude Fable 5:着陆页成本降低94%
我们使用Kimi K2.7 Code和Claude Fable 5生成了12个着陆页。Kimi的成本降低了94%,且每个页面的评分仅相差几分。开源模型不仅更便宜,而且在质量上具有竞争力,差距正在迅速缩小。
一项新实验系统比较了Kimi K2.7 Code与Claude Fable 5在生成着陆页方面的表现。研究人员让这两个模型各自生成了12个着陆页,涵盖B2B SaaS、屋顶酒吧、开发者工具等多种类别,旨在评估开源模型与专有模型在成本和质量上的差距。
实验最初仅依赖简单提示词,例如“为将SQL查询转化为图表的开发者工具构建一个着陆页”。结果两个模型生成的页面都带有明显的AI生成痕迹,缺乏设计独特性。为了提升设计质量,研究人员为Kimi引入了自定义MCP(模型上下文协议)服务器,提供优秀着陆页的截图和UI元素作为视觉参考。由于Kimi K2.7 Code支持多模态,这些图像可以直接嵌入提示中。这一改进显著提升了输出质量:页面层次更清晰,排版更易读,整体构图更富设计感。
成本是实验中最为突出的对比点。Kimi平均每个着陆页仅需4美分,而Claude Fable 5需要1.09美元,相差近27倍。平均而言,Kimi比Fable便宜约16倍,比Claude Opus 4.8便宜约8倍。如果生成100个页面,使用Kimi可节省约94美元。考虑到实际开发中经常需要多次迭代和生成多个变体,这一成本差异会迅速累积。
为了量化质量,研究人员使用GPT-5.5依据评分标准对每个页面进行打分(0-100分),评估因素包括定位、视觉方向、内容结构、工艺、响应式设计和执行质量。结果显示,Claude Fable 5在大多数页面上得分略高,但Kimi的分数紧随其后,差距通常在2-6分之间。例如,在SQL图表工具页面上,Fable得分86,Kimi得分82;在B2B SaaS页面上,Fable得分84,Kimi得分80。Kimi加上MCP后,得分平均提升约5分,有多个页面得分与Fable持平甚至超过。
研究人员总结道,开源模型如Kimi K2.7 Code已经能够生成可用的着陆页,但单纯依赖提示词是不够的。通过提供更好的上下文(如设计参考),并利用低成本进行多次迭代,开源模型在实际工作流中变得非常实用。这一发现表明,开源模型在质量上的差距正在迅速缩小,而成本优势使其成为越来越多团队的首选。