AI News HubLIVE
站内改写3 分で読了

Mate SecurityのAsaf Wienerは、すべてのバックエンドエンジニアをモデルルーターにしました。彼は正しい。

Mate SecurityのCEOであるAsaf Wienerは、AI推論コストの高騰に直面し、単なるコスト削減ではなく、すべてのバックエンドエンジニアが自身のワークロードのモデル選択、評価、ルーティングを担当するように会社を再構築しました。ワークロードレベルでのコスト可視化により、品質とコストの最適化が可能となり、特定のタスクではオープンソースモデルがフロンティアAPIを凌駕することもあります。Wienerは、AIネイティブ企業の唯一の構造的優位性は、その日に利用可能な最良のモデルに対して出荷することであり、それを可能にするのは、法的ポリシーのレビューサイクルを回避し、適応性を重視する「実行モード」の文化であると主張しています。

ソースThe New Stack AI著者: Matthew Burns

Mate SecurityはAIネイティブのセキュリティ運用スタートアップであり、CEOのAsaf Wienerは会社の運営開始から数ヶ月後に、AI推論コストがキャッシュフローを急速に圧迫していることに気づきました。彼はCTOを呼び、スタートアップの資金調達可能期間が約5ヶ月しか残っていないと伝えました。この危機は、彼のCEOダッシュボード上のAI推論コスト線が異常に高い数値を示したことに端を発します。Wienerは単にコストを削減するのではなく、会社の技術アーキテクチャとエンジニアリング文化を根本的に再構築しました。

WienerはAI推論コストを損益計算書の最上位項目と位置づけ、それを約10のサブラインに分割することで、ワークロードレベルのコスト可視性を実現しました。彼は「調査」を基本経済単位とし、各機能の出荷前に、調査あたりのトークンコストを見積もります。これにより、その機能が収益を上げられるか、あるいは顧客に届ける前にコスト削減のために再設計が必要かを判断できます。彼の見解では、この透明性は不可欠であり、最大のコスト線を分解できなければ、どの機能を出荷すべきか、どのマージンが現実的かを弁護可能な形で判断することはできません。

重要な変革は、モデル選択の権限をすべてのバックエンドエンジニアに委譲したことです。Mate Securityでは、各エンジニアが自身のワークロードの評価を担当します。Anthropicが新しいOpusをリリースしたり、GoogleがGeminiを更新したり、Hugging Faceに新しいオープンソースモデルが登場したりすると、担当エンジニアが本番環境に対してテストを実施します。新しいモデルがMateの品質とコスト基準で勝ればワークロードを移行し、そうでなければ現状を維持します。この決定はローカルで行われ、継続的に更新されます。Wienerがよく挙げる例はOpus 4.6から4.7への移行です。多くのAIネイティブチームは即座にアップグレードする傾向がありますが、Mateの評価では特定のワークロードにおいて4.6の方が優れていることが判明し、アップグレードを見送りました。この評価規律により、品質とコストが両立可能になり、特定のタスクではオープンソースモデルがフロンティアAPIを品質とコストの両方で上回ることもあります。

この規律は具体的な成果を生み出しました。Mate Securityは、24時間体制で統合コードを記述するエージェントを開発しました。Wienerによれば、時には一晩で100の統合を生成し、プルリクエストを提供し、さらには自己承認することもあります。セキュリティ企業でエージェントが自己承認することは管理上の問題を提起しますが、Wienerはそれを生産性の結果と位置づけています。この自動化が可能なのは、モデル層がもはや固定されたベンダーコストではないからです。

Wiener自身も同様のワークフローを採用しています。CEOとして営業、マーケティング、Go-to-Marketを担当し、ほとんどの時間をエージェントと協働して過ごしています。彼はClaude Coworkを使ってターゲットアカウントを開拓し、Claude Codeでカスタムアウトバウンドエージェントを構築しています。彼の仕事の進め方は、エンジニアリングチームに求めるものと同じです。タスクを定義し、エージェントにコンテキストを与え、出力を検査し、手作業ではなくワークフローを改善する。

この変化は、Wienerが「実行モード」と呼ぶ文化選択の結果です。Mateはモデルやツールの選択に法的ポリシーのレビューサイクルを課しません。彼の主張は、小企業が大企業に対して持つ唯一の構造的優位性は、機能を出荷するその日において利用可能な最良のモデルを使うことであり、2四半期前のレビューを通過したモデルに頼ることではない、というものです。この文化は採用にも直接影響し、彼は面接で「変化への適応力」をテストし、ワークフローの変更に不快感を覚える候補者を「AI拒否者」として採用しません。

Wienerの率直さは、コスト危機が変革の原動力であったことを認めている点に表れています。AIコストの爆発は、コスト層が機能を出荷するエンジニアから見えなかった、クラウド時代の方法論で運営されていた組織の結果でした。ワークロードレベルで可視化することで評価規律が強制され、それが仕事の再定義につながりました。モデル選択を所有せずに機能を出荷するAIネイティブ企業は、自らの資金調達期間をドアの外に送り出しているに等しいのです。