更便宜、更安全的代理式AI工作流程
一位開發者通過使用GLM-5.2和DeepSeek V4 Flash等模型,實現了低成本、高效的代理式AI編碼,同時通過虛擬機隔離保護隱私。文章分享了具體步驟、成本對比(低至0.034美元)以及對AI行業商業模式的思考。
最近,一位開發者對代理式AI編程進行了實際測試。他使用的代理任務僅花費0.034美元,3分鐘完成,但出現了兩個錯誤。相比之下,他個人手動嘗試需要一小時,卻犯了四個錯誤。這促使他探索更廉價、更安全的AI工作流程。
他首先嚐試了GLM-5.2模型,該模型在基準測試中與三個月前的領先專有AI相當。通過GMI Cloud服務,他獲得了5美元免費額度,並用Debian虛擬機隔離了項目環境以保護隱私。虛擬機中安裝的pi代理在5分鐘內完成任務,花費0.435美元,結果完美。
為了進一步降低成本,他轉向了DeepSeek V4 Flash模型。該模型輸出稍顯冗長,但成本不到GLM-5.2的十分之一。同樣的任務在3分鐘內完成,僅花費0.034美元,儘管出現了兩個小錯誤(將不規則數據系列誤標為“每日”)。他還測試了DeepSeek V4 Pro,零錯誤,耗時2分27秒,花費0.229美元,最終決定將Pro作為主力,Flash用於日常。
為了優化成本,他修改了pi工具的硬編碼限制,將默認最大字節數從50KB降至5KB,顯著減少了輸入令牌數。對於DeepSeek V4 Flash,提示令牌從604k降至431k,總成本從0.034美元降至0.026美元。
作者總結道,他的工作方式發生了根本性變化:不再手動複製粘貼代碼段,而是通過代理完成任務,再對比文件差異。他認為開放權重模型僅落後幾個月,而封閉生態如Anthropic的Claude Code排他性和價格突變是反競爭的。硬件服務商如GMI Cloud和DeepInfra提供靈活價值,硬件折舊週期較長(至少幾年),而模型價值快速貶值。他質疑模型的可持續變現方式,提出了眾籌、非營利或公共事業等可能性。