公司让Claude、Codex像原始人一样说话以降低AI飙升成本
公司正在使用名为'caveman'的插件,让AI工具像原始人一样简略回答,以减少令牌消耗。该插件由Julius Brussee开发,被OpenAI、英伟达等公司员工使用,可将输出令牌减少65-75%。
据404 Media报道,企业正在故意让AI工具像原始人一样说话,以减少令牌消耗并遏制巨额AI支出。这个名为“caveman”的工具将Claude Code、Codex或Gemini等大语言模型通常冗长的输出变为简短直接的答案。例如,不再是“你反驳得对,我错了”,而是“浩克砸”。
该插件的使用直接回应了AI成本飙升且不可预测的问题。此前有报道称,咨询巨头埃森哲发现“令牌消耗飙升”很大程度上源于人们使用AI将PDF转换为演示文稿。caveman的创建者Julius Brussee表示,包括OpenAI、Nvidia和GitHub在内的开发者都在使用该工具。一位OpenAI高级员工甚至为该项目贡献了代码,增加了对OpenAI Codex工具的支持。
Brussee在4月初创建了caveman,因为他发现Claude Code的大量令牌花费在无用的散文上:礼貌用语、保留话、过渡词和闲聊语言。一家使用caveman的公司是电气和数字基础设施巨头Legrand,其内部备忘录要求员工注意AI使用,以免过快用完预算,并列出四项“高影响”措施,包括使用“caveman技能”减少输出消耗。
在测试中,caveman使AI回答更加直接。例如,在要求审查代码后,LLM只问“要改吗?”,并描述“使用官方API,非爬取”。caveman还显示节省的令牌数,测试中节省了约5800令牌(65%)。Brussee表示,caveman将输出令牌减少了65-75%,效果优于简单的“简洁”指令。
用户可以选择“咕噜”级别:轻度、完全(默认)、超级,或文言文(古典中文)。目标是减少输出令牌而不影响准确性。GitHub记录显示OpenAI工程总监Shayne Sweeney为caveman贡献了代码。
该插件还提供完整代理,可将一切压缩为原始人语言。caveman的出现背景是AI成本问题严重:GitHub宣布按令牌收费,Uber在四个月内用尽AI预算,沃尔玛也设置了上限。Sam Altman曾指出用户对LLM说“请”和“谢谢”导致OpenAI电费损失数千万美元。
caveman的GitHub仓库末尾写道:“原始人省令牌,省你钱。”