Mate Security的Asaf Wiener讓每個後端工程師都成為模型路由器。他是對的。
Mate Security的CEO Asaf Wiener在面對高昂的AI推理成本時,沒有選擇簡單削減開支,而是徹底重構了公司的技術結構,讓每個後端工程師都負責自己工作負載的模型選擇、評估和路由。這種將成本可見性下放到工作負載所有者的做法,使公司在保持質量的同時最佳化成本,甚至發現開源模型在某些任務上優於前沿API。Wiener強調,AI原生公司的競爭優勢在於能夠迅速切換到當天最好的模型,而這需要一種不接受“AI拒絕者”的快速執行文化。
Mate Security是一家AI原生安全運營初創公司,其CEO Asaf Wiener在公司運營數月後發現AI推理成本正在迅速吞噬現金流。他召集CTO,告知公司僅剩約五個月的運營資金。這個危機源於他CEO儀表盤上的AI推理成本線,數額驚人。Wiener沒有選擇簡單削減開支,而是徹底重構了公司的技術架構和工程文化。
Wiener將AI推理成本視為公司損益表中的第一行,並將其拆分為大約10個子項,以實現工作負載級別的成本可見性。他以“調查”為基本經濟單位,在每項功能釋出前估算其每次調查的令牌成本。這使他能做出明智決策:某個功能是否能以盈利定價,或者必須在交付客戶前重新設計以降低成本。這種透明度在他的理念中不可妥協——如果無法分解最大的成本線,就無法判斷哪些功能值得釋出,哪些利潤率是真實的。
關鍵變革在於模型選擇權力的下放。在Mate Security,每位後端工程師都負責自己工作負載的模型評估和路由。當Anthropic釋出新版Opus、Google更新Gemini或Hugging Face上出現新開源模型時,負責的工程師會針對生產環境進行測試。如果新模型在質量和成本上勝出,工作負載便遷移;否則保持不變。決策是本地化且持續更新的。Wiener以Opus 4.6到4.7的過渡為例:許多AI原生團隊傾向於立即升級,但Mate的評估發現4.6在某些工作負載上更優,因此他們選擇不升級。這種評估紀律使質量與成本相相容,甚至讓開源模型在特定任務上同時超越前沿API。
這一紀律帶來了具體成果:Mate Security開發了可24/7編寫整合程式碼的代理。Wiener表示,有時一夜之間代理能生成100個整合,並提供拉取請求,甚至自行批准。代理自行批准PR在安全公司引發控制問題,但Wiener將其視為生產力成果。自動化之所以可能,是因為模型層不再是公司被鎖定的單一固定供應商成本。
Wiener本人也在採用類似工作流。作為CEO,他負責銷售、市場和獲客,大部分時間與代理協同工作。他使用Claude Cowork挖掘目標賬戶,用Claude Code構建定製出境代理。他的工作方式正是他希望工程團隊採用的:定義任務、提供上下文、檢查輸出,而非手動執行。
這一轉變源於Wiener所稱的“執行模式”文化。Mate不對模型或工具選擇施加法律政策審查週期。Wiener認為,一家小公司相對於大公司的唯一結構性優勢是在功能釋出當天使用最佳可用模型,而非等待兩個季度前的審查結果。這種文化直接影響招聘:他測試候選人的“變化適應力”,拒絕那些不適應工作流更迭的“AI拒絕者”。
Wiener的坦誠在於承認成本危機推動了變革。AI成本爆炸是組織沿用雲時代方法的後果,成本層對釋出功能的工程師不可見。透過將成本可見性下放到工作負載所有者,Mate不僅最佳化了成本,還重塑了工程師角色。現在,後端工程師的日常工作更像研究或ML平臺工程師——決定程式碼路由到哪個模型、在什麼條件下、以什麼成本。這一結構性變化使Mate能夠比大公司更快地利用最新模型,這正是Wiener認為的AI原生初創公司的唯一結構性優勢。