今週のAI:Fable 5、クローンウェーブ、そしてUberのAI現実確認
今週、egghead.ioの共同創業者John LindquistがホストYK Sugiとともに、Claude Fable 5の物議を醸したリリース、AI支出に関する財務シフト、そしてエージェント時代における実用的なフレームワークについて議論しました。主なトピックは、Fable 5を停止させた政府指令、Uberが2026年のAI予算を4月までに使い果たしたこと、Johnの「原料は推論に勝る」アプローチです。また、SpaceXによるCursor買収やSalesforceによるFin買収についても触れられています。
今週、egghead.ioの共同創業者John LindquistがホストYK Sugi(CS Dojo創業者兼Eventualの開発者エクスペリエンスマネージャー)とともに、最新のAIニュースをカバーしました。最初の議題は、物議を醸したClaude Fable 5のリリースでした。また、エージェンティックコーディングループに関連するコスト上昇を含む、テクノロジー業界を再形成する財務シフトについても検討しました。その後、Johnはエージェント時代に毎回ゼロから始めることなく構築するためのフレームワークを概説しました。
Claude Fable 5は6月9日にリリースされ、6月12日には、米国政府がAnthropicに対して国内外の外国人のアクセスを制限するよう指示した指令を受けて、すべての顧客から削除されました。Amazonの研究者がセキュリティ脆弱性を報告し、Anthropicがパッチ適用やモデルの再デプロイを拒否した後、指令が下りました。その後、Anthropicの上級スタッフはワシントンに赴き、ホワイトハウス当局者と会談しました。実際に何が起こったのかについては未解決の論争があります。Anthropicの立場は、報告された問題は以前に特定された狭い範囲のジェイルブレイクであり、公開モデル全般に存在するもので、深刻なセキュリティ脅威ではないというものです。報告書をレビューした独立研究者は、これを既知の脆弱性を表面化させる防御的プロンプティングであると述べ、過剰反応と呼びました。どちらの側も技術やプロンプトを公開していないため、主張を独立して評価する方法はありません。しかしJohnが言うように、「これはモデルがリリースされるにあたり、政府が介入して民間企業がモデルで何をできるかできないかを管理できるという、非常に奇妙な前例を設定します。」
もう一つの新しい前例:Fable 5はOpusやSonnetアーキテクチャに基づいて構築されていないため、以前のAnthropicモデルや同世代モデルとの比較はあまり意味がありません。しかし、初期の印象は肯定的で、YKやJohnを含め、Fable 5はすぐにArenaリーダーボードのテキスト、エージェント、ウェブ開発コードカテゴリでトップに立ちました。ただし、このモデルには意図的な制限もありました。AIと機械学習トレーニングに関連する質問に対しては、ユーザーに通知することなく、パフォーマンスが低下するように設計されていました。これは、競合他社がモデルを改善するために使用するのを防ぐためです。開示なしに商用モデルで意図的に能力を抑制することは、安全ガードレールとは異なる種類の製品決定です。競争上の利害が高まるにつれて、このアプローチがより一般的になるかどうかは未解決の疑問です。
ループが準備できていないと、トークンは急速に燃焼します。先週、SpaceXは史上最大のIPOで上場しました。同社はその後、Cursorを600億ドルの全株式取引で買収しました。OpenAIとAnthropicも上場申請を行っており、Googleは株式と100年債を通じて約1,600億ドルを調達しました。その資本のかなりの部分がAIコーディングインフラに流れています。
YKはまた、Uberが2026年のAIツール予算全体を4月までに使い果たしたという、あまり祝賀的でない財務ストーリーを持ち出しました。その大部分はClaude CodeとCursorに費やされ、UberのCOO Andrew Macdonaldは、その支出を測定可能な有益な顧客機能の増加に結び付けられないことを認めました。Uberはその後、従業員1人あたり月額1,500ドルの上限を設定しました。
Johnは、エージェンティックループを非効率的に利用するプロジェクトが、無駄なトークン消費の原因の一つである可能性を指摘しました。既存のコードベースに対してエージェントを展開するほとんどの開発者は、エージェントが効率的に動作するために必要なツールを構築していないため、エージェントは行き止まりの作業、コンテキストの繰り返し、またはかなりのデバッグを必要とするコードの生成にトークンを消費します。彼は次のように説明しました:「レガシーコードベースを取り、それに対してループを持つエージェントを投入しても、適切なエージェント環境を設定していないことになります。トークンは非常に速く燃焼します。なぜなら…エージェントが作業するためのツールを持っていないからです。」
開発者コミュニティでの議論はこれまでほぼ完全にエージェントが何を生成できるかに焦点を当ててきました。しかし、より多くの組織が実験から本番規模の展開に移行するにつれて、ログ記録、検証、適切なエラーサーフェスをエージェントツールに組み込むことが、トークン消費が実際の出力にマッピングされるかどうかを決定します。そうでなければ、おそらくより多くの企業がUberの道を歩むことになるでしょう。
ほとんどの開発者ワークフローにおいて、今日の「買うか作るか」は、1〜2年前とは異なり、作る方向に傾いています。Johnが述べたように、「今ではアプリやワークフローを構築するのが非常に簡単です。なぜなら、多くの素晴らしいプロダクションアプリ、スマートフォンアプリ、デスクトップアプリ、SaaSがあり、それらをコピーしてクローンするのは簡単だからです。」彼は「クローンウェーブ」という用語を使って、消費者ソフトウェア製品のオープンソース相当品の拡大するセットを説明し、これらをクローン、フォーク、または置き換えることで、ユースケースの99%に到達できます。
クローンウェーブを駆動する原則は「原料は推論に勝る」です。エージェントにゼロから機能を構築するよう依頼すると、外部参照なしで解決策を推論します。既存のオープンソース実装を出発点として与えると、はるかに速く、より信頼性高くコードを適応、翻訳、統合できます。原料アプローチは、YKがこのエピソードの前半で引用した、AI生成コードの43%が本番でデバッグを必要とするという問題にも役立ちます。
GitHub CLIはこのワークフローで中心的な役割を果たします。Johnは、エージェントがGitHub CLIをネイティブに理解するため、エージェントに検索タスクを与え、自分では生成しなかった実装を見つけさせることができると説明しました。言語の不一致は障壁になりません。エージェントは言語やライブラリ間でうまく翻訳するからです。そして、CognitionのDeepWikiのようなツールは、エージェントがクローンやフォークの前にリポジトリの構造を探索して理解することを可能にし、評価ステップにローカルセットアップを必要としません。
このフレームワークは、原料として利用できない最後の20%を構築する方法にも拡張されます。これはユースケースに固有の部分であり、Johnはそれを「あなた自身またはユーザーのためにカスタムプロダクトやプロジェクトにするためにその上に構築する余分なビット」と表現しました。Johnのより大きなポイントは、自分自身のために構築するツールはエージェントにも使用可能であるべきだということです。エンドポイントとログを公開します。エージェントに状態とエラーを読み取る能力を与えます。ツールを制御できるがデバッグできないエージェントは、診断が難しい方法で最終的に停止します。
Johnはcmuxを例に、エージェントネイティブなワークスペースが実際にどのように見えるかを示しました。cmuxはエージェンティックワークフローを念頭に構築されたターミナルマルチプレクサで、エージェントが直接制御できるCLIを公開します。そのため、ターミナルペインを開き、そのペインが別のペインを生成し、2つが相互に読み書きできます。実際には、1つのペインでClaude Codeを実行し、別のペインでCodexを実行し、3番目のペインで両方の出力を読み取ることができ、各エージェントが他のエージェントの状態を観察できます。
エージェントにはコマンドを実行する能力以上のものが必要です。ログを読み、エラーをチェックし、次のステップに進む前に状態を確認する必要があります。これらのサーフェスを公開するワークスペースは、エージェントにフィードバックループを与えます。この原則は会社全体のツールに適用可能です。内部ツールをエージェントアクセス可能なインフラとして扱う組織は、複合的に成長するものを構築しています。エージェントをブラックボックスコードジェネレーターとして扱う組織は、後で問題が発生するまで見えない技術的負債を抱えています。
次に、SpaceXによるCursor買収は、コーディングエージェント競争をIDEの戦いよりもはるかに大きなものに変えます。Cursorは、エージェントがコードを書き、レビューし、テストし、修復し、管理するエージェント時代の新しいGitHubとして位置づけようとしているかもしれません。同時に、SalesforceによるFinの36億ドル買収は、エンタープライズソフトウェア内で同じパターンを示しています。買い手は、抽象的な「エージェント」ではなく、実際のサポート、販売、運用の問題を解決するパッケージ化されたワークフローを望んでいます。
来週、ホストのKsenia Seは、誰がAIが作業を行うループを所有するかというレンズを通して、これらのストーリーなどを見ていきます。AIの次のフェーズが、インフラ、経済、信頼レイヤーを誰が制御するかについてである理由を探るためにご参加ください。エピソードは6月末まで無料で公開されています。ライブ参加をご希望の方はこちらから登録してください。毎週金曜日にRadarで要点を公開し、YouTube、Spotify、Apple、またはお好きなポッドキャストプラットフォームで完全なエピソードを共有します。