2026-05-25 12:40 UTC+8站內改寫3 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

DeepSeek V4還能更省！新工具快取命中率高達99.82%，2折穩定到手

DeepSeek V4系列釋出一個月後，開源社群推出Reasonix工具，專為DeepSeek設計，透過最佳化快取機制將賬單成本降低至原來的五分之一左右。該工具快取命中率高達99.82%，實現4億+token從61美元降至12美元。

來源量子位作者: 鱼羊

DeepSeek V4還能更省！新工具快取命中率高達99.82%，2折穩定到手 – 量子位

魚羊 2026-05-25 12:40:14

來源：量子位

原本4億+token、61美元的賬單，直降至12美元

魚羊發自凹非寺

量子位 | 公眾號 QbitAI

我悟了，DeepSeek V4系列釋出1個月，價格屠夫的本色這才剛剛發力啊！

官方這邊，打折促銷期還沒過，折上折價格已官宣落定為永久降價。

就這樣，開源社群仍不滿足。您猜怎麼著？快取命中率直接給幹到99.82%了！

什麼概念？就是原本4億+token、61美元（合人民幣414元）的賬單，能直降至12美元（合人民幣81元），2折輕鬆到手。

老哥老姐們給這個名為Reasonix的專案點星都點瘋了，狀態be like：

具體來說，Reasonix是一款專為DeepSeek打造的終端coding harness，核心目的很簡單，就是兩個字：省錢——

長會話能把快取命中保持在90%+，輸入token成本降到1/5的那種。

DeepSeek原生程式設計Agent

Reasonix的實現思路也不復雜，最核心的一點是：基於位元組穩定prefix-cache設計的append-only執行迴圈。

就是說，Reasonix的工作流程是專門為了DeepSeek的快取機制設計的：舊的上下文固定不動，新訊息只往後追加，儘量保證每一輪請求的前半部分完全一樣，從而提高快取命中率，降低長會話成本。

具體架構可以拆分成3個部分來看。

快取優先迴圈（Cache-First Loop）

自動字首快取（prefix-cache）僅在當前請求的精確位元組字首和先前請求匹配時才會啟用，想要提高快取命中率，需要解決的是大多數智慧體迴圈會在每次互動時重新排序、重寫或注入新的時間戳的問題。

Reasonix的解決方案是把上下文劃分為三個區域：

這樣，字首會被固定下來，在每個會話中僅計算一次；歷史訊息只追加不重寫；而草稿區中的任何資訊在歸入日誌前，均需透過Tool-Call Repair進行提煉。

工具呼叫修復（Tool-Call Repair）

DeepSeek比較容易遇到的問題包括：

工具呼叫JSON在內部已經生成，但在最終訊息裡卻消失不見；

模型想呼叫工具，但引數寫歪了，即JSON引數畸形；

同一工具被反覆呼叫且引數完全相同，即重複呼叫風暴；

JSON被截斷。

工具呼叫修復會透過4輪處理，讓Reasonix在真正執行前，先嚐試修復這些問題。

成本控制

首先，預設優先使用v4 flash，困難任務才會切pro。

其次，輪次結束自動壓縮上下文。

使用者要是覺得下一次任務比較難，就輸入/pro，這樣下一輪對話模型就會切換為v4 pro。跑完這一輪後Reasonix自動切回便宜模型，無需使用者手動更改。

最後，失敗訊號會觸發自動升級：失敗次數到達警戒線後，當前輪次的剩餘部分就會切到v4 pro上執行。

Reasonix在安裝使用方面也比較簡單。

兩步即可執行，無需全域性安裝：

進入專案目錄；

輸入：npx reasonix code，啟動TUI會話。

不習慣用終端的話，Reasonix還提供了桌面版。

以及再次再次高亮一下來自Reasonix官方的提醒：

Reasonix只為DeepSeek打造，每一個抽象層級都基於DeepSeek的Feature構建，完全不通用，也“不會發布通用功能”。

One More Thing

省錢的事情，大傢伙當然喜聞樂見，畢竟也不是每個人都能像龍蝦之父Peter那樣無限狂燒公司token。

於是關於Reasonix的討論，是輕輕鬆鬆就蓋了幾百樓。

不少小夥伴已經摩拳擦掌躍躍欲試，但也有人提出疑問：

我們真的需要一個DeepSeek原生程式設計Agent嗎？

有網友分享說，Ta寫了一個微型橋接程式，在Codex中使用DeepSeek V4 Pro，同樣實現了95%以上的高快取命中。

並且Ta“沒做任何特殊處理，只是將DeepSeek API的格式調整為Codex所需要的”。

anyway，harness和harness之間肯定是有區別的。就有網友分享說，在Claude Code裡使用DeepSeek V4比在OpenCode上省錢。

甭管你用了哪一種方案，都歡迎在評論區分享分享心得體驗。

大家省才是真的省（doge）。

專案地址：

https://github.com/esengine/DeepSeek-Reasonix

參考連結：[1]

https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs/ARCHITECTURE.md#pillar-1–cache-first-loop[2]

https://esengine.github.io/DeepSeek-Reasonix/index.html#agents

Deepseek Harness

魚羊

騰訊開源 Agent 記憶技術方案，Token 消耗最高降低 61%2026-05-14

DeepSeek識圖模式是個新模型？！一手實測在此（沒錯我被灰度到了）2026-04-30

DeepSeek不惜代價保住它！V4關鍵特性被挖出來了2026-04-28

DeepSeek V4終於釋出！打破最強閉源壟斷，明確攜手華為晶片2026-04-24