更便宜、更安全的代理式AI工作流程
一位开发者通过使用GLM-5.2和DeepSeek V4 Flash等模型,实现了低成本、高效的代理式AI编码,同时通过虚拟机隔离保护隐私。文章分享了具体步骤、成本对比(低至0.034美元)以及对AI行业商业模式的思考。
最近,一位开发者对代理式AI编程进行了实际测试。他使用的代理任务仅花费0.034美元,3分钟完成,但出现了两个错误。相比之下,他个人手动尝试需要一小时,却犯了四个错误。这促使他探索更廉价、更安全的AI工作流程。
他首先尝试了GLM-5.2模型,该模型在基准测试中与三个月前的领先专有AI相当。通过GMI Cloud服务,他获得了5美元免费额度,并用Debian虚拟机隔离了项目环境以保护隐私。虚拟机中安装的pi代理在5分钟内完成任务,花费0.435美元,结果完美。
为了进一步降低成本,他转向了DeepSeek V4 Flash模型。该模型输出稍显冗长,但成本不到GLM-5.2的十分之一。同样的任务在3分钟内完成,仅花费0.034美元,尽管出现了两个小错误(将不规则数据系列误标为“每日”)。他还测试了DeepSeek V4 Pro,零错误,耗时2分27秒,花费0.229美元,最终决定将Pro作为主力,Flash用于日常。
为了优化成本,他修改了pi工具的硬编码限制,将默认最大字节数从50KB降至5KB,显著减少了输入令牌数。对于DeepSeek V4 Flash,提示令牌从604k降至431k,总成本从0.034美元降至0.026美元。
作者总结道,他的工作方式发生了根本性变化:不再手动复制粘贴代码段,而是通过代理完成任务,再对比文件差异。他认为开放权重模型仅落后几个月,而封闭生态如Anthropic的Claude Code排他性和价格突变是反竞争的。硬件服务商如GMI Cloud和DeepInfra提供灵活价值,硬件折旧周期较长(至少几年),而模型价值快速贬值。他质疑模型的可持续变现方式,提出了众筹、非营利或公共事业等可能性。