AI News HubLIVE
站內改寫1 分鐘閱讀

公司讓Claude、Codex像原始人一樣説話以降低AI飆升成本

公司正在使用名為'caveman'的插件,讓AI工具像原始人一樣簡略回答,以減少令牌消耗。該插件由Julius Brussee開發,被OpenAI、英偉達等公司員工使用,可將輸出令牌減少65-75%。

來源Hacker News AI作者: beardyw

據404 Media報道,企業正在故意讓AI工具像原始人一樣説話,以減少令牌消耗並遏制鉅額AI支出。這個名為“caveman”的工具將Claude Code、Codex或Gemini等大語言模型通常冗長的輸出變為簡短直接的答案。例如,不再是“你反駁得對,我錯了”,而是“浩克砸”。

該插件的使用直接回應了AI成本飆升且不可預測的問題。此前有報道稱,諮詢巨頭埃森哲發現“令牌消耗飆升”很大程度上源於人們使用AI將PDF轉換為演示文稿。caveman的創建者Julius Brussee表示,包括OpenAI、Nvidia和GitHub在內的開發者都在使用該工具。一位OpenAI高級員工甚至為該項目貢獻了代碼,增加了對OpenAI Codex工具的支持。

Brussee在4月初創建了caveman,因為他發現Claude Code的大量令牌花費在無用的散文上:禮貌用語、保留話、過渡詞和閒聊語言。一家使用caveman的公司是電氣和數字基礎設施巨頭Legrand,其內部備忘錄要求員工注意AI使用,以免過快用完預算,並列出四項“高影響”措施,包括使用“caveman技能”減少輸出消耗。

在測試中,caveman使AI回答更加直接。例如,在要求審查代碼後,LLM只問“要改嗎?”,並描述“使用官方API,非爬取”。caveman還顯示節省的令牌數,測試中節省了約5800令牌(65%)。Brussee表示,caveman將輸出令牌減少了65-75%,效果優於簡單的“簡潔”指令。

用户可以選擇“咕嚕”級別:輕度、完全(默認)、超級,或文言文(古典中文)。目標是減少輸出令牌而不影響準確性。GitHub記錄顯示OpenAI工程總監Shayne Sweeney為caveman貢獻了代碼。

該插件還提供完整代理,可將一切壓縮為原始人語言。caveman的出現背景是AI成本問題嚴重:GitHub宣佈按令牌收費,Uber在四個月內用盡AI預算,沃爾瑪也設置了上限。Sam Altman曾指出用户對LLM説“請”和“謝謝”導致OpenAI電費損失數千萬美元。

caveman的GitHub倉庫末尾寫道:“原始人省令牌,省你錢。”