Kimi K2.7 Code vs Claude Fable 5:着陸頁成本降低94%
我們使用Kimi K2.7 Code和Claude Fable 5生成了12個着陸頁。Kimi的成本降低了94%,且每個頁面的評分僅相差幾分。開源模型不僅更便宜,而且在質量上具有競爭力,差距正在迅速縮小。
一項新實驗系統比較了Kimi K2.7 Code與Claude Fable 5在生成着陸頁方面的表現。研究人員讓這兩個模型各自生成了12個着陸頁,涵蓋B2B SaaS、屋頂酒吧、開發者工具等多種類別,旨在評估開源模型與專有模型在成本和質量上的差距。
實驗最初僅依賴簡單提示詞,例如“為將SQL查詢轉化為圖表的開發者工具構建一個着陸頁”。結果兩個模型生成的頁面都帶有明顯的AI生成痕跡,缺乏設計獨特性。為了提升設計質量,研究人員為Kimi引入了自定義MCP(模型上下文協議)服務器,提供優秀着陸頁的截圖和UI元素作為視覺參考。由於Kimi K2.7 Code支持多模態,這些圖像可以直接嵌入提示中。這一改進顯著提升了輸出質量:頁面層次更清晰,排版更易讀,整體構圖更富設計感。
成本是實驗中最為突出的對比點。Kimi平均每個着陸頁僅需4美分,而Claude Fable 5需要1.09美元,相差近27倍。平均而言,Kimi比Fable便宜約16倍,比Claude Opus 4.8便宜約8倍。如果生成100個頁面,使用Kimi可節省約94美元。考慮到實際開發中經常需要多次迭代和生成多個變體,這一成本差異會迅速累積。
為了量化質量,研究人員使用GPT-5.5依據評分標準對每個頁面進行打分(0-100分),評估因素包括定位、視覺方向、內容結構、工藝、響應式設計和執行質量。結果顯示,Claude Fable 5在大多數頁面上得分略高,但Kimi的分數緊隨其後,差距通常在2-6分之間。例如,在SQL圖表工具頁面上,Fable得分86,Kimi得分82;在B2B SaaS頁面上,Fable得分84,Kimi得分80。Kimi加上MCP後,得分平均提升約5分,有多個頁面得分與Fable持平甚至超過。
研究人員總結道,開源模型如Kimi K2.7 Code已經能夠生成可用的着陸頁,但單純依賴提示詞是不夠的。通過提供更好的上下文(如設計參考),並利用低成本進行多次迭代,開源模型在實際工作流中變得非常實用。這一發現表明,開源模型在質量上的差距正在迅速縮小,而成本優勢使其成為越來越多團隊的首選。