AI编码支出去向:48%写代码,40%思考
一位开发者通过自建工具CodeBurn追踪AI编码API支出,发现30天内$7,890的支出中仅47.9%用于实际编码,其余花费在探索代码库、调试、委托子代理和对话上。文章详细介绍了CodeBurn的功能,包括仪表盘、模型对比、浪费检测、产出追踪等。
文章情报
要点
- 仅47.9%的AI编码支出用于实际写代码,40%用于思考过程。
- CodeBurn是一款开源CLI工具,可分类13种API调用任务。
- 工具支持23个AI编码提供者,并提供浪费检测和收益追踪功能。
- 通过优化可节省约8%的支出。
为什么重要
这条新闻值得关注,因为仅47.9%的AI编码支出用于实际写代码,40%用于思考过程。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
一位开发者最近分享了他对AI编码工具支出进行详细分析的结果。他在30天内通过105,718次API调用花费了7,890美元,但令人惊讶的是,只有47.9%的费用用于实际生成代码。其余大部分支出来自探索代码库(11.1%)、委托子代理(9.7%)、调试(8.8%)、功能开发(8.3%)以及对话(5.9%)等活动。
为了精确追踪这些支出,他开发了一个名为CodeBurn的命令行工具。该工具直接从磁盘读取AI编码会话数据,并将每次API调用分类到13个任务类别中,如编码、对话、功能开发、探索、调试、重构、测试、委托、Git操作、构建/部署、头脑风暴、规划和通用。分类完全基于工具使用模式和消息关键词,无需API密钥或外部调用,确保结果可重现。
CodeBurn提供交互式仪表盘,显示每日成本、项目、模型、活动分类等关键指标。其中活动面板特别有用,可以直观看到每类任务的支出占比。例如,在一次典型会话中,编码支出为19.08美元,对话仅为3.29美元。如果对话持续占据主导,说明你很可能在为聊天付费而非实际产出。
通过模型对比功能,用户可以看到不同模型在不同任务上的表现。例如,Claude Opus 4.6在编码任务上的单次成功率为88.2%,而Opus 4.7为89.9%,但后者在调试任务上达到了100%成功率。这些数据帮助用户选择最适合特定任务的模型,避免过度支付。
CodeBurn的优化功能可以扫描会话历史,发现可修复的浪费模式。一次扫描发现了6个问题,潜在可节省约25.4万令牌(约17.18美元),占总支出的8%。常见问题包括重复文件读取、未限制的bash输出、未使用的MCP服务器等。
产出追踪功能通过交叉引用AI会话时间戳与git提交历史,将会话分类为生产性、回滚或放弃。在一次测试中,12个会话被标记为放弃,涉及143.95美元。这不一定浪费,但如果持续出现,需要评估这些会话的价值。
CodeBurn还支持订阅计划跟踪,帮助用户判断当前订阅是否物有所值。例如,如果每月Claude Max订阅200美元但仅使用了80美元等值的API,那么降级到Pro可能更划算。
该工具自动检测用户使用的AI编码工具,支持Claude Code、Codex、Cursor、GitHub Copilot等23个提供者,无需额外配置。它还提供macOS菜单栏应用和Linux GNOME扩展,方便实时查看支出。
通过npx codeburn@latest即可开始使用,无需账户,数据不会离开本地。该工具已在GitHub开源,并提供了详细的文档和Discord社区支持。