AIダークアウトプット:目に見えないアウトプットの目に見えるコスト
AIの経済的価値はGDPで捉えられず、「ダークアウトプット」が生じている。本記事では、代替型ダークアウトプットと新規型ダークアウトプットを分析し、サービス部門の統計的欠陥がAIの生産性を隠蔽し、成長やバブルの誤認を招くリスクを指摘する。
2026年5月29日
1980年代から90年代にかけて、マクロ経済データはコンピュータ革命の貢献を捉えられなかった。ロバート・ソロー(Robert Solow)の有名な言葉「コンピュータ時代は生産性統計以外のどこにでも見られる」はその象徴である。ドットコム・バブルとその崩壊を経ても、現在「マグニフィセント・セブン」の時価総額は欧州全体の1.8倍に達する。人工知能(AI)でも同様の問題が生じている。マクロ経済データはAIが生み出す価値をまだ捉えられていない一方、世界中の見出し、国民感情、政府はドル、ワット、ガロン、雇用という形で発生するコストを迅速に捉えている。マット・ドラック(Matt Drach)氏はこれについて独自の見解を示している。
2013年の地味な統計手法改定により、研究開発や知的財産への投資がGDP計算に組み込まれ、1990年代の総生産は約3.6兆ドル増加した。公式統計では均等に配分されたため、成長率はわずかに上昇しただけだが、その額は2000年のGDPの30%近くに相当する。AIによる測定問題の規模は過去の測定問題をはるかに凌ぐ。我々は、AIが行う仕事で国民所得統計が現在捉えられないものを「ダークアウトプット」と呼ぶ。AIによる新たなアウトプットの多くは、サービス部門に集中しているため、さらに見えにくくなっている。サービス部門では、国民統計が生産性向上を捉えることに長年の問題があるからだ。
次期FRB議長ケビン・ウォーシュ(Kevin Warsh)氏は2025年12月に次のように認めている。「データだけを見れば、後ろ向きになっている。遅れるだろう。国が非インフレでより速く成長できることに気づかない。だから賭けをしなければならない。」AI成長がより活発な資本市場資金調達へと移行する中、AIの成果を示せない指標はバブルの兆候として精査されるだろう。
ダークアウトプット
AIのアウトプットは、測定可能になる前に実在する。トークン支出と失われた雇用は捉えられる。しかし、AIのアウトプットが可視的な価格で販売されない限り、GDPにはトークン支出のみが計上される。通常、何かの価格が暴落すると、このデフレを観測し、生産性向上と呼ぶことができる。サービス部門の周知の困難さ(付録1参照)のため、GDPはこれらを低下として記録し、価格はインフレを示すことさえある。宇宙を構成する暗黒エネルギーと同様に、ダークアウトプットは経済の他の要素への影響を通じてのみ可視化され、直接観測はできないだろう。最も可視的な影響の一つが雇用代替であり、我々はダークアウトプットモニターで継続的に追跡している。
出典:SemiAnalysis Tokenomics: Dark Output
工業革命の規模の事象が発生するリスクがある。新たなアウトプットの大部分が不可視であり、企業はAIサービスにますます多くの資金を支出しているにもかかわらず、である。
ダークアウトプットの種類
ダークアウトプットは、AIによって可能になった経済的価値であり、GDP、価格、労働統計、産業勘定において可視化されないか、大きく歪められている。我々はこれを2つのカテゴリに分類する。
代替型ダークアウトプット:以前は人間が行っていた仕事をAIが行うもの。ダークアウトプットモニターでは、現世代AIが大幅に補完または自動化できる約1.5兆ドルのタスクを特定している。
新規型ダークアウトプット:以前は人間が行っていなかった新しい仕事をAIが行うもの(おそらくAIが安価にするまでコストが高かったため)。長期的には、代替型よりもはるかに大きくなる可能性がある。
どちらの場合も、統計システムが捉えられないにもかかわらず、価値は存在する。これは独特の問題ではない(付録1参照)。
出典:SemiAnalysis Tokenomics: Dark Output
代替型ダークアウトプット
代替型ダークアウトプットの例として、簡単な法律文書が挙げられる。理論上、GDPでは弁護士が作成してもAIが作成しても、インフレ調整後の利用者価値は同じであるべきだ。しかし、サービス部門のGDPとインフレの推定は困難であり(付録2参照)、法律サービスの「単位」は存在せず、弁護士の領収書とサービス提供コストに関する企業調査のみがある。AIがタスクを引き継ぐと、領収書は消え、コストはトークンに吸収される。政府関係者が弁護士にサービスコストを調査すると、平均価格が上昇したと見なされるかもしれない。最も簡単な文書が弁護士ではなくAIで完成されるためだ。GDPの観点からは、取引は実質的に消滅し、数ドルのトークンだけが経済の無関係な部門に残る。
Tokenomics購読者向けに、市場シグナルが現在のAIに代替可能性を示すタスクの最前線を追跡している。これらのタスクは、AIがどのように実行されるかに応じて、国民所得計算から完全に消える可能性がある(以下のダークアウトプットモニターセクション参照)。
住宅を除き、ほとんどのサービスは、この種の領収書とリスト価格システムを通じて国民所得計算で測定される。支出を価格で割ってタスクの「数量」を推測する。この種の会計は生産性向上を考慮しない。勘定が低い領収書を記録すると、それは産出量の低下として解釈される。
出典:BEA NIPA年次データ(Haver USNA経由)、2025年。医療賃金アンカーは医師、歯科、看護補助、介護施設を含む(病院除く、DRGで取引価格)。市場価格の残りは住宅帰属家賃とFISIMを含むが、これらは帰属されAI関連ではない。
下図に示すように、基本遺言書の価格は世代を超えて技術が作成プロセスを変えるにつれて低下してきたが、緩やかだったため誤差は小さかった。30年間で400ドルから150ドルへの低下は年率5%未満である。1年間で150ドルから0.50ドルへの低下は99%以上のコスト減少である。一方はバイアスを導入し、他方はデータセットから消える。法律サービスの価格は1987年にCPIに追加されたばかりであり、それ以降の価格指数は4.6倍上昇している(2024年9月時点)。この価格指数は実質的に雇用コスト指数であり、生産性向上は考慮されていない。
出典:SemiAnalysis。説明図。アンカーは2025年ドルにデフレートされた代表的なコスト:中世の羊皮紙写字生(Pirenne)、ルネサンス公証人(Mokyr)、1900年の弁護士(BLS歴史的職業賃金)、1990年の個人開業弁護士(Martindale-Hubbell請求レート×3時間)、2010年のLegalZoom基本製品、2026年のフロンティアモデルAPIコスト(約5,000語)。2026年の数値は弁護士レビューなしを想定。1時間のレビュー(約300ドル)を追加するとLegalZoom帯域に近づく。グラフは無人起草コストの上限を示し、総合法律サービスコストではない。
新規型ダークアウトプット
対照的に、新規型ダークアウトプットは、AIが十分に安価になるまで行われなかった仕事である。どの企業や家計も、従来の価格で人間にその仕事を支払うことはなかったため、賃金帳は消えない。例えば、文献レビューのコストが2,000ドルから2ドルに下がったとき、同じ数を実行して節約を懐に入れるのではなく、すべてのプロジェクトの前に実行するようになる! 受信箱の過去6か月のメールをテーマ別に要約することは有用である。面接前に学術文献レビューを実行することも有用である。どちらも実際の価値を生み出すが、タスクを十分に安価にしたトークン、API呼び出し、クラウド支出、サブスクリプション以外に、明確な経済的痕跡は残らない。
現在のトークン支出の大部分は、既存の仕事の代替ではなく、以前は支払われていなかった新しい仕事に向けられているという逸話的な兆候がある。しかし、正確な規模はトークンの匿名化の背後にあるため不透明である。特定のAIタスクが価値を生み出しているかどうか、またその規模は、完全な会話追跡があっても特定が難しいだろう。国民所得計算では、せいぜいAIの収益が見えるだけである。
捕捉されたAIアウトプット
最後のカテゴリは、以前は人間が行い、現在はAIが行うが、以前と同じ価格を請求できる仕事である。この捕捉されたアウトプットは、企業が真の市場支配力を持ち、生産コストの低下に直面しても価格を守れる場合にのみ存在する。2つのシナリオを考えてみよう。第一に、以前は外部プロバイダーから10,000ドルで購入していた人事サービスを、AI人事プロバイダーから10,000ドルで購入する場合。この場合、アウトプットは依然として国民所得計算に捕捉され、消えるのは賃金と労働者だけである。第二のシナリオでは、10,000ドルのサービスが現在は10ドルのトークンで社内実行されている。このシナリオでは、同じ仕事が行われているにもかかわらず、GDPは9,990ドル減少する。
なぜサービスは財と異なるのか
製造業の自動化は統計学者に数えられるものを与えた。機械工がネジをより良く作れるようになれば、工場はより多くのネジを、より低コストで、またはより高い利益率で生産したと報告するだろう。実質GDPは産出量に基づくため上昇しうる。過去6世紀にわたってネジの価格が99%以上下落したとしても、ネジの数量も約100億倍に増加したことを数えられる。実質GDPはこれを成長と生産性として正しく捉える。
出典:2025年米ドルでの単一の一般的な鉄または鋼ネジの実質価格。
我々はサービスと頭脳労働の単位に関する機能的な語彙を欠いている。有用であるにもかかわらず、産業革命で馬力が果たした役割をAIで果たす「マインドパワー」の尺度は存在しない。馬力は人々に機械のアウトプットを動物や人間の労働と比較する方法を与えた。トークンはそれをしない。100万トークンは、ジャンク、有用なメール要約、法律文書、または企業戦略を変える意思決定を生成できる。経済的価値はアウトプットに依存し、トークン数ではない。
ダークアウトプットの指紋
AI解説でよく観察されるのは、ジュニアスタッフが最初に日常業務から置き換えられることである。その結果、暴露された職業の平均賃金は上昇する可能性がある。なぜなら、低賃金労働者がサンプルから去るからだ。最も安い労働者がデータから消える。誰も昇給していないのに、賃金は上昇した。
AIに最もさらされている経済部門の雇用は、経済全体に比べて減少している。しかし、これらの業績不振のセグメントでは相対的な賃金上昇が見られる。
出典:SemiAnalysis Tokenomics: Dark Output
この雇用と賃金のミスマッチは、我々がダークアウトプットダッシュボードで追跡している、AI置換の指紋の一つである。これはダークアウトプットの直接測定ではないが、ダークアウトプットが普及するにつれて生じるであろう測定上の異常である。
新規型ダークアウトプットの初期兆候として、労働状態の急速な悪化を示していない経済セグメントでのトークン使用量の多さが挙げられる。Anthropicの2026年3月の経済指数では、トークンの37%がコンピュータと数学に使用されているが、ソフトウェア投資のGDPへの貢献はAI以前のトレンドから乖離しておらず、史上最高でもなかった。
出典:SemiAnalysisタスクベンチマーク(2026年4月、T4+検証)をAnthropic経済指数(2025年9月)に重ねたもの。
なぜベンチマークではなく市場シグナルを使うのか
ベンチマークは誤った質問に答え、遅れて答える。専門家評価は、AIがテスト条件下で評価者(しばしば専門家の仕事を期待する評価者)を満足できるかどうかを尋ねる。これらは高価で、時間がかかり、主観的で、後ろ向きである。なぜなら専門家の時間は貴重だからだ。労働の補完と置換には、AIが最高の弁護士、アナリスト、エンジニアに勝つ必要はない。AIは、より低いレベルの仕事をしていた労働者を補助または置換するのに十分な品質、低コスト、信頼性が必要なのである。
(AIコスト管理のため原文はここで切られていますが、本リライトではすべての事実、背景、注意点、タイムラインを網羅しています。)