AI News HubLIVE
站内改写

AI編碼支出去向:48%寫代碼,40%思考

一位開發者通過自建工具CodeBurn追蹤AI編碼API支出,發現30天內$7,890的支出中僅47.9%用於實際編碼,其餘花費在探索代碼庫、調試、委託子代理和對話上。文章詳細介紹了CodeBurn的功能,包括儀表盤、模型對比、浪費檢測、產出追蹤等。

文章情報

工程師中級

要點

  • 僅47.9%的AI編碼支出用於實際寫代碼,40%用於思考過程。
  • CodeBurn是一款開源CLI工具,可分類13種API調用任務。
  • 工具支持23個AI編碼提供者,並提供浪費檢測和收益追蹤功能。
  • 通過優化可節省約8%的支出。

為甚麼重要

這條新聞值得關注,因為僅47.9%的AI編碼支出用於實際寫代碼,40%用於思考過程。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

一位開發者最近分享了他對AI編碼工具支出進行詳細分析的結果。他在30天內通過105,718次API調用花費了7,890美元,但令人驚訝的是,只有47.9%的費用用於實際生成代碼。其餘大部分支出來自探索代碼庫(11.1%)、委託子代理(9.7%)、調試(8.8%)、功能開發(8.3%)以及對話(5.9%)等活動。

為了精確追蹤這些支出,他開發了一個名為CodeBurn的命令行工具。該工具直接從磁盤讀取AI編碼會話數據,並將每次API調用分類到13個任務類別中,如編碼、對話、功能開發、探索、調試、重構、測試、委託、Git操作、構建/部署、頭腦風暴、規劃和通用。分類完全基於工具使用模式和消息關鍵詞,無需API密鑰或外部調用,確保結果可重現。

CodeBurn提供交互式儀表盤,顯示每日成本、項目、模型、活動分類等關鍵指標。其中活動面板特別有用,可以直觀看到每類任務的支出佔比。例如,在一次典型會話中,編碼支出為19.08美元,對話僅為3.29美元。如果對話持續佔據主導,説明你很可能在為聊天付費而非實際產出。

通過模型對比功能,用户可以看到不同模型在不同任務上的表現。例如,Claude Opus 4.6在編碼任務上的單次成功率為88.2%,而Opus 4.7為89.9%,但後者在調試任務上達到了100%成功率。這些數據幫助用户選擇最適合特定任務的模型,避免過度支付。

CodeBurn的優化功能可以掃描會話歷史,發現可修復的浪費模式。一次掃描發現了6個問題,潛在可節省約25.4萬令牌(約17.18美元),佔總支出的8%。常見問題包括重複文件讀取、未限制的bash輸出、未使用的MCP服務器等。

產出追蹤功能通過交叉引用AI會話時間戳與git提交歷史,將會話分類為生產性、回滾或放棄。在一次測試中,12個會話被標記為放棄,涉及143.95美元。這不一定浪費,但如果持續出現,需要評估這些會話的價值。

CodeBurn還支持訂閲計劃跟蹤,幫助用户判斷當前訂閲是否物有所值。例如,如果每月Claude Max訂閲200美元但僅使用了80美元等值的API,那麼降級到Pro可能更划算。

該工具自動檢測用户使用的AI編碼工具,支持Claude Code、Codex、Cursor、GitHub Copilot等23個提供者,無需額外配置。它還提供macOS菜單欄應用和Linux GNOME擴展,方便實時查看支出。

通過npx codeburn@latest即可開始使用,無需賬户,數據不會離開本地。該工具已在GitHub開源,並提供了詳細的文檔和Discord社區支持。