AI News HubLIVE
站内改写2 分钟阅读

Mate Security的Asaf Wiener让每个后端工程师都成为模型路由器。他是对的。

Mate Security的CEO Asaf Wiener在面对高昂的AI推理成本时,没有选择简单削减开支,而是彻底重构了公司的技术结构,让每个后端工程师都负责自己工作负载的模型选择、评估和路由。这种将成本可见性下放到工作负载所有者的做法,使公司在保持质量的同时优化成本,甚至发现开源模型在某些任务上优于前沿API。Wiener强调,AI原生公司的竞争优势在于能够迅速切换到当天最好的模型,而这需要一种不接受“AI拒绝者”的快速执行文化。

来源The New Stack AI作者: Matthew Burns

Mate Security是一家AI原生安全运营初创公司,其CEO Asaf Wiener在公司运营数月后发现AI推理成本正在迅速吞噬现金流。他召集CTO,告知公司仅剩约五个月的运营资金。这个危机源于他CEO仪表盘上的AI推理成本线,数额惊人。Wiener没有选择简单削减开支,而是彻底重构了公司的技术架构和工程文化。

Wiener将AI推理成本视为公司损益表中的第一行,并将其拆分为大约10个子项,以实现工作负载级别的成本可见性。他以“调查”为基本经济单位,在每项功能发布前估算其每次调查的令牌成本。这使他能做出明智决策:某个功能是否能以盈利定价,或者必须在交付客户前重新设计以降低成本。这种透明度在他的理念中不可妥协——如果无法分解最大的成本线,就无法判断哪些功能值得发布,哪些利润率是真实的。

关键变革在于模型选择权力的下放。在Mate Security,每位后端工程师都负责自己工作负载的模型评估和路由。当Anthropic发布新版Opus、Google更新Gemini或Hugging Face上出现新开源模型时,负责的工程师会针对生产环境进行测试。如果新模型在质量和成本上胜出,工作负载便迁移;否则保持不变。决策是本地化且持续更新的。Wiener以Opus 4.6到4.7的过渡为例:许多AI原生团队倾向于立即升级,但Mate的评估发现4.6在某些工作负载上更优,因此他们选择不升级。这种评估纪律使质量与成本相兼容,甚至让开源模型在特定任务上同时超越前沿API。

这一纪律带来了具体成果:Mate Security开发了可24/7编写集成代码的代理。Wiener表示,有时一夜之间代理能生成100个集成,并提供拉取请求,甚至自行批准。代理自行批准PR在安全公司引发控制问题,但Wiener将其视为生产力成果。自动化之所以可能,是因为模型层不再是公司被锁定的单一固定供应商成本。

Wiener本人也在采用类似工作流。作为CEO,他负责销售、市场和获客,大部分时间与代理协同工作。他使用Claude Cowork挖掘目标账户,用Claude Code构建定制出境代理。他的工作方式正是他希望工程团队采用的:定义任务、提供上下文、检查输出,而非手动执行。

这一转变源于Wiener所称的“执行模式”文化。Mate不对模型或工具选择施加法律政策审查周期。Wiener认为,一家小公司相对于大公司的唯一结构性优势是在功能发布当天使用最佳可用模型,而非等待两个季度前的审查结果。这种文化直接影响招聘:他测试候选人的“变化适应力”,拒绝那些不适应工作流更迭的“AI拒绝者”。

Wiener的坦诚在于承认成本危机推动了变革。AI成本爆炸是组织沿用云时代方法的后果,成本层对发布功能的工程师不可见。通过将成本可见性下放到工作负载所有者,Mate不仅优化了成本,还重塑了工程师角色。现在,后端工程师的日常工作更像研究或ML平台工程师——决定代码路由到哪个模型、在什么条件下、以什么成本。这一结构性变化使Mate能够比大公司更快地利用最新模型,这正是Wiener认为的AI原生初创公司的唯一结构性优势。