更便宜、更安全的代理式AI工作流程
一位開發者透過使用GLM-5.2和DeepSeek V4 Flash等模型,實現了低成本、高效的代理式AI編碼,同時透過虛擬機器隔離保護隱私。文章分享了具體步驟、成本對比(低至0.034美元)以及對AI行業商業模式的思考。
最近,一位開發者對代理式AI程式設計進行了實際測試。他使用的代理任務僅花費0.034美元,3分鐘完成,但出現了兩個錯誤。相比之下,他個人手動嘗試需要一小時,卻犯了四個錯誤。這促使他探索更廉價、更安全的AI工作流程。
他首先嚐試了GLM-5.2模型,該模型在基準測試中與三個月前的領先專有AI相當。透過GMI Cloud服務,他獲得了5美元免費額度,並用Debian虛擬機器隔離了專案環境以保護隱私。虛擬機器中安裝的pi代理在5分鐘內完成任務,花費0.435美元,結果完美。
為了進一步降低成本,他轉向了DeepSeek V4 Flash模型。該模型輸出稍顯冗長,但成本不到GLM-5.2的十分之一。同樣的任務在3分鐘內完成,僅花費0.034美元,儘管出現了兩個小錯誤(將不規則資料系列誤標為“每日”)。他還測試了DeepSeek V4 Pro,零錯誤,耗時2分27秒,花費0.229美元,最終決定將Pro作為主力,Flash用於日常。
為了最佳化成本,他修改了pi工具的硬編碼限制,將預設最大位元組數從50KB降至5KB,顯著減少了輸入令牌數。對於DeepSeek V4 Flash,提示令牌從604k降至431k,總成本從0.034美元降至0.026美元。
作者總結道,他的工作方式發生了根本性變化:不再手動複製貼上程式碼段,而是透過代理完成任務,再對比檔案差異。他認為開放權重模型僅落後幾個月,而封閉生態如Anthropic的Claude Code排他性和價格突變是反競爭的。硬體服務商如GMI Cloud和DeepInfra提供靈活價值,硬體折舊週期較長(至少幾年),而模型價值快速貶值。他質疑模型的可持續變現方式,提出了眾籌、非營利或公共事業等可能性。