2026-06-26 06:56 UTC+8站內改寫4 分鐘閱讀更新: 2026-06-26 07:14 UTC+8

DeepSeek Flash 顛覆了智能代理產品的經濟模式

DeepSeek Flash 通過提供廉價、快速、純文本的代碼生成模型，打破了開發者與大型模型實驗室之間不合理的定價關係。它使得智能代理的構建者能夠從依賴昂貴的多模態 API 轉向使用開源模型作為編譯器，大幅降低成本並重構了瀏覽器代理的架構。

來源Hacker News AI作者: arjunchint

DeepSeek Flash 的出現正在從根本上改變智能代理產品的經濟格局。長期以來，開發者與大型模型實驗室之間存在一種對抗關係：開發者支付高昂的 API 費用，而這些利潤卻被實驗室用來補貼自己的應用程序、代理工具和消費者訂閲服務。這意味着，如果你在構建 AI IDE、瀏覽器代理、支持代理或工作流產品，你實際上在資助那些試圖取代你的公司。

這種不合理的交易在智能代理市場一直存在：使用最好的封閉模型，支付税款，然後看着同一家實驗室推出與你競爭的產品。DeepSeek Flash 打破了這種格局。它並非因為是最聰明的模型，而是因為它精準地擊中了智能代理產品長期以來的痛點：廉價、快速、純文本的代碼生成。

DeepSeek V4 Flash 是開放的、廉價的、具有長上下文能力，並且在代碼方面足夠強大，使得“捆綁”再次成為護城河。一旦模型能夠將瀏覽器工作編譯為可執行代碼，推理提供商就開始在託管上展開價格戰，每個非最先進的模型賬單都變得可選。據報道，就連微軟也在考慮將 DeepSeek 用於 Copilot Cowork，因為其代理定價正轉向基於使用量的模式。

兩年來，默認的瀏覽器代理棧一直荒謬地運行着：截圖 -> 大語言模型 -> 點擊 -> 截圖 -> 大語言模型 -> 輸入 -> 截圖 -> 大語言模型 -> 重複。這種架構不僅將模型用於判斷，還將其視為運行時環境。這對 API 賬單有利，但對代理產品卻是災難。簡單來説，開發者被榨取了運行時費用，而非智能費用。大型實驗室可以向外部構建者收取每輪代理循環的溢價 API 費用，同時補貼自己的第一方代理體驗。如果你的代理需要 80 次模型調用來完成一個工作流，那不是定價模型的缺陷，而是商業模式本身。

DeepSeek 推翻了這種模式。一旦一個廉價的文本/代碼模型能夠一次性寫出計劃，並且瀏覽器捆綁能夠本地執行該計劃，前沿 API 的護城河就大大縮小了。模型不必成為工人，它可以成為編譯器。這正是我們新架構 Retriever 背後的真正解鎖：DOM + 工具 + 意圖 -> DeepSeek Flash -> JavaScript 計劃 -> rtrvr.* 捆綁 -> 瀏覽器操作。

代碼即計劃改變了一切。一個原本需要 40 到 100 次模型調用的工作流，現在可以變成一次規劃調用、幾次有針對性的語義提取，以及普通的 JavaScript 以機器速度執行枯燥的工作。對於 Retriever 來説，將熱路徑切換到 DeepSeek Flash 帶來了超過 100 倍的成本降低，同時保持了所需的實際瀏覽器代理性能。

這不僅僅是更便宜的模型替換，而是每個代理捆綁構建者的新談判地位。我們做出了五個架構上的賭注：文本優於截圖，代碼優於工具調用記錄，捆綁即產品，經過身份驗證的瀏覽器即運行時，截圖作為後備而非税款。DeepSeek Flash 使這種架構變得足夠廉價，成為默認路徑。

我對任何構建代理的人的建議是：重寫你的捆綁，使其默認以文本為中心，並通過可執行代碼調用。模型應該根據你的能力生成程序，而不是監控每一次循環迭代。舊的瀏覽器代理循環是瓶頸。一個普通的瀏覽器代理是這樣工作的： while not done: 觀察頁面 -> 大語言模型生成動作 -> 執行工具。這種構建簡單但運行殘酷。以查找定價頁面為例，工具循環代理需要為每個標籤頁支付模型調用來提取和追加數據，而代碼方案則是一次循環寫入，本地執行。

DeepSeek 打破了實驗室税款。代理捆綁不需要在熱路徑中使用昂貴的模型，它們需要一個能夠讀取緊湊狀態、寫出可靠代碼並迅速退出的模型。這就是為什麼 DeepSeek Flash 如此重要：它改變了默認假設，從“使用最昂貴的多模態模型直到單位經濟受損”轉變為“使用廉價的開放代碼規劃器，然後讓捆綁執行”。

舊的護城河是：更好的模型 -> 更多工具調用成功 -> 溢價 API 定價。新的護城河是：更好的捆綁 -> 更少的模型調用 -> 廉價模型變得足夠好。這對大型實驗室來説是殘酷的逆轉。如果代理運行時是一項漫長的大語言模型對話，前沿提供商掌握着你的利潤；如果運行時是一個捆綁，模型只編譯計劃，那麼性價比勝出。最好的代理棧開始看起來不像“每一步都租用最大的模型”，而更像“使用能寫出正確程序的最廉價模型”。

DeepSeek Flash 在瀏覽器代理最耗錢的地方削弱了 API 税款。這就是為什麼開放權重對代理如此重要：一旦模型在捆綁代碼上足夠好，託管就變成商品優化問題。提供商在延遲、批處理、量化、緩存行為、地理位置和價格上競爭，代理公司不再受制於實驗室的產品策略。

緩存文本是缺失的倍增器。對於純文本瀏覽器代理有一個公平的批評：便宜並不自動意味着快速。但如果你的架構每一步都向模型輸入 30,000 個標記的扁平化 DOM，你可以贏得賬單但失去用户。文本的真正優勢在於可以被緩存、切片和執行。DeepSeek 的緩存輸入路徑是隱藏功能：在官方 API 上，V4 Flash 緩存命中輸入的價格約為每百萬標記 0.0028 美元。更重要的是，代理捆綁的穩定部分正是那些緩存良好的部分。截圖沒有同樣的緩存故事，而文本則不同。

“純文本”作為更便宜的提示格式和“純文本”作為執行架構是有區別的。錯誤的文本代理每一步都發送整個頁面，正確的文本代理發送足夠的頁面狀態來生成代碼，緩存穩定前綴，然後讓代碼以字符串和結構化對象操作 DOM。所以，是的，測量每步延遲，但同時也要測量每成功運行的模型調用次數、緩存命中率、每步上下文增長和端到端任務時間。代碼即計劃改善了所有這些指標，因為它首先將循環從模型中移除。

100 倍的提升是架構性的。這不是説 DeepSeek 神奇地便宜 100 倍，而是成本曲線因為四個乘數同時移動而改變：成本 = 調用次數 * 上下文大小 * 未緩存比例 * 模型價格。我們通過將工作流編譯為代碼減少了調用次數，通過使用 DOM/文本而不是截圖減少了上下文大小，通過重用穩定文本前綴減少了未緩存比例，通過將熱路徑移至 DeepSeek Flash 降低了模型價格。對於舊代理需要 40 到 100 次模型調用而新代理只需要一次規劃調用加幾次語義提取的任務，端到端推理成本可以下降大約兩個數量級。速度也發生了變化：工具循環本質上是串行的，而代碼可以迭代、過濾、批處理、重試、去重並寫入輸出，無需在每個步驟都向模型請求許可。這比基準測試更重要。一個演示可能花費 80 次模型調用來完成一次結賬，但一個產品不能讓用户在每次同步 500 行數據時都經歷 80 次模型調用。