AI News HubLIVE
站内改写

DeepSeek V4還能更省!新工具快取命中率高達99.82%,2折穩定到手

DeepSeek V4系列釋出一個月後,開源社群推出Reasonix工具,專為DeepSeek設計,透過最佳化快取機制將賬單成本降低至原來的五分之一左右。該工具快取命中率高達99.82%,實現4億+token從61美元降至12美元。

文章情報

工程師進階

要點

  • Reasonix是專為DeepSeek打造的終端編碼工具,核心目標是降低使用成本。
  • 透過快取優先迴圈、工具呼叫修復和自動上下文壓縮等機制,實現長會話快取命中率超90%。
  • 安裝簡單,兩步即可執行,且預設使用便宜模型,困難任務自動切換。
  • 社群反響熱烈,但部分使用者認為不一定需要專用的程式設計Agent。

為什麼重要

這條新聞值得關注,因為Reasonix是專為DeepSeek打造的終端編碼工具,核心目標是降低使用成本。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

DeepSeek V4還能更省!新工具快取命中率高達99.82%,2折穩定到手 – 量子位

DeepSeek V4還能更省!新工具快取命中率高達99.82%,2折穩定到手

魚羊 2026-05-25 12:40:14

來源:量子位

原本4億+token、61美元的賬單,直降至12美元

魚羊 發自 凹非寺

量子位 | 公眾號 QbitAI

我悟了,DeepSeek V4系列釋出1個月,價格屠夫的本色這才剛剛發力啊!

官方這邊,打折促銷期還沒過,折上折價格已官宣落定為永久降價。

就這樣,開源社群仍不滿足。您猜怎麼著?快取命中率直接給幹到99.82%了!

什麼概念?就是原本4億+token、61美元(合人民幣414元)的賬單,能直降至12美元(合人民幣81元),2折輕鬆到手。

老哥老姐們給這個名為Reasonix的專案點星都點瘋了,狀態be like:

具體來說,Reasonix是一款專為DeepSeek打造的終端coding harness,核心目的很簡單,就是兩個字:省錢——

長會話能把快取命中保持在90%+,輸入token成本降到1/5的那種。

DeepSeek原生程式設計Agent

Reasonix的實現思路也不復雜,最核心的一點是:基於位元組穩定prefix-cache設計的append-only執行迴圈。

就是說,Reasonix的工作流程是專門為了DeepSeek的快取機制設計的:舊的上下文固定不動,新訊息只往後追加,儘量保證每一輪請求的前半部分完全一樣,從而提高快取命中率,降低長會話成本。

具體架構可以拆分成3個部分來看。

快取優先迴圈(Cache-First Loop)

自動字首快取(prefix-cache)僅在當前請求的精確位元組字首和先前請求匹配時才會啟用,想要提高快取命中率,需要解決的是大多數智慧體迴圈會在每次互動時重新排序、重寫或注入新的時間戳的問題。

Reasonix的解決方案是把上下文劃分為三個區域:

這樣,字首會被固定下來,在每個會話中僅計算一次;歷史訊息只追加不重寫;而草稿區中的任何資訊在歸入日誌前,均需透過Tool-Call Repair進行提煉。

工具呼叫修復(Tool-Call Repair)

DeepSeek比較容易遇到的問題包括:

工具呼叫JSON在內部已經生成,但在最終訊息裡卻消失不見;

模型想呼叫工具,但引數寫歪了,即JSON引數畸形;

同一工具被反覆呼叫且引數完全相同,即重複呼叫風暴;

JSON被截斷。

工具呼叫修復會透過4輪處理,讓Reasonix在真正執行前,先嚐試修復這些問題。

成本控制

首先,預設優先使用v4 flash,困難任務才會切pro。

其次,輪次結束自動壓縮上下文。

使用者要是覺得下一次任務比較難,就輸入/pro,這樣下一輪對話模型就會切換為v4 pro。跑完這一輪後Reasonix自動切回便宜模型,無需使用者手動更改。

最後,失敗訊號會觸發自動升級:失敗次數到達警戒線後,當前輪次的剩餘部分就會切到v4 pro上執行。

Reasonix在安裝使用方面也比較簡單。

兩步即可執行,無需全域性安裝:

進入專案目錄;

輸入:npx reasonix code,啟動TUI會話。

不習慣用終端的話,Reasonix還提供了桌面版。

以及再次再次高亮一下來自Reasonix官方的提醒:

Reasonix只為DeepSeek打造,每一個抽象層級都基於DeepSeek的Feature構建,完全不通用,也“不會發布通用功能”。

One More Thing

省錢的事情,大傢伙當然喜聞樂見,畢竟也不是每個人都能像龍蝦之父Peter那樣無限狂燒公司token。

於是關於Reasonix的討論,是輕輕鬆鬆就蓋了幾百樓。

不少小夥伴已經摩拳擦掌躍躍欲試,但也有人提出疑問:

我們真的需要一個DeepSeek原生程式設計Agent嗎?

有網友分享說,Ta寫了一個微型橋接程式,在Codex中使用DeepSeek V4 Pro,同樣實現了95%以上的高快取命中。

並且Ta“沒做任何特殊處理,只是將DeepSeek API的格式調整為Codex所需要的”。

anyway,harness和harness之間肯定是有區別的。就有網友分享說,在Claude Code裡使用DeepSeek V4比在OpenCode上省錢。

甭管你用了哪一種方案,都歡迎在評論區分享分享心得體驗。

大家省才是真的省(doge)。

專案地址:

https://github.com/esengine/DeepSeek-Reasonix

參考連結:[1]

https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs/ARCHITECTURE.md#pillar-1–cache-first-loop[2]

https://esengine.github.io/DeepSeek-Reasonix/index.html#agents

版權所有,未經授權不得以任何形式轉載及使用,違者必究。

Deepseek Harness

魚羊

騰訊開源 Agent 記憶技術方案,Token 消耗最高降低 61%2026-05-14

DeepSeek識圖模式是個新模型?!一手實測在此(沒錯我被灰度到了)2026-04-30

DeepSeek不惜代價保住它!V4關鍵特性被挖出來了2026-04-28

DeepSeek V4終於釋出!打破最強閉源壟斷,明確攜手華為晶片2026-04-24

相關閱讀

DeepSeek“極你太美”bug,官方回應了

新版本將修復

十三2025-08-27

bug Deepseek DeepSeek V3.1

DeepSeek官方推薦:R1要這樣設定

一共四項內容

十三2025-02-15

Deepseek DeepSeek R1

剛剛,DeepSeek能看懂貓片了!騰訊混元加持

免費無限用

白交2025-02-21

Deepseek 騰訊元寶

“DeepSeek甚至繞過了CUDA”,論文細節再引熱議,工程師靈魂提問:輝達護城河還在嗎?

輝達剛剛從DeepSeek-R1引發的4萬億元暴跌中緩過勁來,又面臨新的壓力?

西風2025-01-29

CUDA Deepseek

DeepSeek-R1持續震撼矽谷:躋身競技榜前三,創始人梁文鋒採訪被“拿放大鏡”看

LeCun也點評了

明敏2025-01-25

Deepseek

火山引擎AI一體機DeepSeek版來了!開箱即用,小時級部署,還有大模型應用經驗加持

打通模型到應用“最後一公里”

魚羊2025-02-27

Deepseek 火山引擎

熱門文章

AI水論文封一年,署名連坐!arXiv最嚴新規來了,陶哲軒附議

2026-05-18

智象未來超兩千億引數影像大模型HiDream-O1-Image-Pro釋出,融資持續提速

2026-05-20

菲爾茲獎得主都看懵了:OpenAI非數學模型首次自主突破80年未解數學難題

2026-05-21

openJiuwen社群開源新招:重磅釋出JiuwenSwarm,拉開群體智慧“養蜂”序幕

2026-05-18

太初元碁洪源:異構計算能力將成為未來AI算力基礎設施的重要方向|AIGC2026

2026-05-20

掃碼關注量子位

量子位 QbitAI 版權所有©北京極客夥伴科技有限公司 京ICP備17005886號-1