2026-06-26 06:56 UTC+8站內改寫4 分鐘閱讀更新: 2026-06-26 07:14 UTC+8

DeepSeek Flash 顛覆了智慧代理產品的經濟模式

DeepSeek Flash 透過提供廉價、快速、純文本的程式碼生成模型，打破了開發者與大型模型實驗室之間不合理的定價關係。它使得智慧代理的構建者能夠從依賴昂貴的多模態 API 轉向使用開源模型作為編譯器，大幅降低成本並重構了瀏覽器代理的架構。

來源Hacker News AI作者: arjunchint

DeepSeek Flash 的出現正在從根本上改變智慧代理產品的經濟格局。長期以來，開發者與大型模型實驗室之間存在一種對抗關係：開發者支付高昂的 API 費用，而這些利潤卻被實驗室用來補貼自己的應用程式、代理工具和消費者訂閱服務。這意味著，如果你在構建 AI IDE、瀏覽器代理、支援代理或工作流產品，你實際上在資助那些試圖取代你的公司。

這種不合理的交易在智慧代理市場一直存在：使用最好的封閉模型，支付稅款，然後看著同一家實驗室推出與你競爭的產品。DeepSeek Flash 打破了這種格局。它並非因為是最聰明的模型，而是因為它精準地擊中了智慧代理產品長期以來的痛點：廉價、快速、純文本的程式碼生成。

DeepSeek V4 Flash 是開放的、廉價的、具有長上下文能力，並且在程式碼方面足夠強大，使得“捆綁”再次成為護城河。一旦模型能夠將瀏覽器工作編譯為可執行程式碼，推理提供商就開始在託管上展開價格戰，每個非最先進的模型賬單都變得可選。據報道，就連微軟也在考慮將 DeepSeek 用於 Copilot Cowork，因為其代理定價正轉向基於使用量的模式。

兩年來，預設的瀏覽器代理棧一直荒謬地執行著：截圖 -> 大語言模型 -> 點選 -> 截圖 -> 大語言模型 -> 輸入 -> 截圖 -> 大語言模型 -> 重複。這種架構不僅將模型用於判斷，還將其視為執行時環境。這對 API 賬單有利，但對代理產品卻是災難。簡單來說，開發者被榨取了執行時費用，而非智慧費用。大型實驗室可以向外部構建者收取每輪代理迴圈的溢價 API 費用，同時補貼自己的第一方代理體驗。如果你的代理需要 80 次模型呼叫來完成一個工作流，那不是定價模型的缺陷，而是商業模式本身。

DeepSeek 推翻了這種模式。一旦一個廉價的文本/程式碼模型能夠一次性寫出計劃，並且瀏覽器捆綁能夠本地執行該計劃，前沿 API 的護城河就大大縮小了。模型不必成為工人，它可以成為編譯器。這正是我們新架構 Retriever 背後的真正解鎖：DOM + 工具 + 意圖 -> DeepSeek Flash -> JavaScript 計劃 -> rtrvr.* 捆綁 -> 瀏覽器操作。

程式碼即計劃改變了一切。一個原本需要 40 到 100 次模型呼叫的工作流，現在可以變成一次規劃呼叫、幾次有針對性的語義提取，以及普通的 JavaScript 以機器速度執行枯燥的工作。對於 Retriever 來說，將熱路徑切換到 DeepSeek Flash 帶來了超過 100 倍的成本降低，同時保持了所需的實際瀏覽器代理效能。

這不僅僅是更便宜的模型替換，而是每個代理捆綁構建者的新談判地位。我們做出了五個架構上的賭注：文本優於截圖，程式碼優於工具呼叫記錄，捆綁即產品，經過身份驗證的瀏覽器即執行時，截圖作為後備而非稅款。DeepSeek Flash 使這種架構變得足夠廉價，成為預設路徑。

我對任何構建代理的人的建議是：重寫你的捆綁，使其預設以文本為中心，並透過可執行程式碼呼叫。模型應該根據你的能力生成程式，而不是監控每一次迴圈迭代。舊的瀏覽器代理迴圈是瓶頸。一個普通的瀏覽器代理是這樣工作的： while not done: 觀察頁面 -> 大語言模型生成動作 -> 執行工具。這種構建簡單但執行殘酷。以查詢定價頁面為例，工具迴圈代理需要為每個標籤頁支付模型呼叫來提取和追加資料，而程式碼方案則是一次迴圈寫入，本地執行。

DeepSeek 打破了實驗室稅款。代理捆綁不需要在熱路徑中使用昂貴的模型，它們需要一個能夠讀取緊湊狀態、寫出可靠程式碼並迅速退出的模型。這就是為什麼 DeepSeek Flash 如此重要：它改變了預設假設，從“使用最昂貴的多模態模型直到單位經濟受損”轉變為“使用廉價的開放程式碼規劃器，然後讓捆綁執行”。

舊的護城河是：更好的模型 -> 更多工具呼叫成功 -> 溢價 API 定價。新的護城河是：更好的捆綁 -> 更少的模型呼叫 -> 廉價模型變得足夠好。這對大型實驗室來說是殘酷的逆轉。如果代理執行時是一項漫長的大語言模型對話，前沿提供商掌握著你的利潤；如果執行時是一個捆綁，模型只編譯計劃，那麼價效比勝出。最好的代理棧開始看起來不像“每一步都租用最大的模型”，而更像“使用能寫出正確程式的最廉價模型”。

DeepSeek Flash 在瀏覽器代理最耗錢的地方削弱了 API 稅款。這就是為什麼開放權重對代理如此重要：一旦模型在捆綁程式碼上足夠好，託管就變成商品最佳化問題。提供商在延遲、批處理、量化、快取行為、地理位置和價格上競爭，代理公司不再受制於實驗室的產品策略。

快取文本是缺失的倍增器。對於純文本瀏覽器代理有一個公平的批評：便宜並不自動意味著快速。但如果你的架構每一步都向模型輸入 30,000 個標記的扁平化 DOM，你可以贏得賬單但失去使用者。文本的真正優勢在於可以被快取、切片和執行。DeepSeek 的快取輸入路徑是隱藏功能：在官方 API 上，V4 Flash 快取命中輸入的價格約為每百萬標記 0.0028 美元。更重要的是，代理捆綁的穩定部分正是那些快取良好的部分。截圖沒有同樣的快取故事，而文本則不同。

“純文本”作為更便宜的提示格式和“純文本”作為執行架構是有區別的。錯誤的文本代理每一步都傳送整個頁面，正確的文本代理傳送足夠的頁面狀態來生成程式碼，快取穩定字首，然後讓程式碼以字串和結構化物件操作 DOM。所以，是的，測量每步延遲，但同時也要測量每成功執行的模型呼叫次數、快取命中率、每步上下文增長和端到端任務時間。程式碼即計劃改善了所有這些指標，因為它首先將迴圈從模型中移除。

100 倍的提升是架構性的。這不是說 DeepSeek 神奇地便宜 100 倍，而是成本曲線因為四個乘數同時移動而改變：成本 = 呼叫次數 * 上下文大小 * 未快取比例 * 模型價格。我們透過將工作流編譯為程式碼減少了呼叫次數，透過使用 DOM/文本而不是截圖減少了上下文大小，透過重用穩定文本字首減少了未快取比例，透過將熱路徑移至 DeepSeek Flash 降低了模型價格。對於舊代理需要 40 到 100 次模型呼叫而新代理只需要一次規劃呼叫加幾次語義提取的任務，端到端推理成本可以下降大約兩個數量級。速度也發生了變化：工具迴圈本質上是序列的，而程式碼可以迭代、過濾、批處理、重試、去重並寫入輸出，無需在每個步驟都向模型請求許可。這比基準測試更重要。一個演示可能花費 80 次模型呼叫來完成一次結賬，但一個產品不能讓使用者在每次同步 500 行資料時都經歷 80 次模型呼叫。