中国のAIラボからのメモ
中国の主要なAIラボを訪問した著者は、謙虚で実用的なファストフォロワー文化を発見した。中国の研究者(多くは学生)は、エゴが少なく、哲学的な議論よりも構築に集中している。エコシステムは初期の国内AI需要を示すが、データ産業は未発達で、Nvidiaチップへの渇望が強い。
杭州から上海への高速列車の窓から、風力発電機が点在する山並みと夕日を背景にした摩天楼が見える。今回の中国訪問は大きな謙虚さをもたらした。見知らぬ土地で温かく迎えられることは、人間味あふれる経験だ。遠くから知っていたAIエコシステムの人々と会い、彼らの笑顔に迎えられ、自分の仕事とAIエコシステムのグローバルさを再認識した。
中国の言語モデルを構築する企業は、教育と仕事の文化的伝統と、テクノロジー企業の構築に対する微妙に異なるアプローチに基づき、完璧なファストフォロワーとして位置づけられている。出力と要素を見ると、中国と米国の研究所は大きく似ているが、組織化とコンディショニングに永続的な違いがある。
中国の研究所がフロンティアに追いつき続ける理由の一つは、文化的にこのタスクに適応していることだ。多くの素晴らしく謙虚な研究者との会話を通じて、この直感が確固たるものになった。最高のLLMを構築するには、データからアーキテクチャの詳細、RLアルゴリズムの実装に至るまで、スタック全体にわたる細心の作業が必要だ。すべてのポイントで改善が可能だが、それらを統合する複雑なプロセスでは、マルチオブジェクティブ最適化を最大化するために、一部の優秀な個人の作業を棚上げする必要がある。
米国の研究者も個々のコンポーネントで明らかに優れているが、米国では自己主張の文化が強い。科学者は自分の仕事を主張することで成功しやすく、現代文化は「リーディングAI科学者」への道を押し進めている。これが直接的な対立を生む。Llama組織はこれらの利害が階層組織に埋め込まれた結果、崩壊したと噂されている。一方、中国の研究所では、中核的な貢献者の多くが現役の学生である。学生は仲間として扱われ、LLMチームに直接統合されている。これはOpenAIやAnthropicなどのトップ米国研究所がインターンシップを提供しないのとは大きく異なる。
文化の微妙な変化がモデル構築能力を向上させる方法:最終モデルを改善するために派手でない作業を進んで行う、AI構築の新人は以前のAIサイクルの影響を受けず新しい技術に適応しやすい、エゴが少なく組織図をスケールしやすい、豊富な人材が既存の概念実証を解決するのに適している。この傾向は、中国の研究者が創造的で0から1の学術研究を生み出さないというステレオタイプとは対照的だ。学術的な研究所ではより野心的な研究文化を育成しようとしているが、技術リーダーは教育とインセンティブシステムの再設計が必要で短期間では難しいと懐疑的だ。
学生は新鮮な目でLLMに取り組む。過去数年でLLMのパラダイムはMoEのスケーリングからRLのスケーリング、エージェントの有効化へと変化した。これらをうまく行うには膨大な文脈を素早く吸収する必要がある。学生はこれに慣れており、謙虚に前提を捨ててモデル改善に専念する。彼らは哲学的な雑音に邪魔されず、単に最高のモデルを構築することに集中している。経済や社会的リスクについて質問すると、中国の研究者は洗練された意見を持たず、影響力を行使しようとしない。この違いは、英語を流暢に話す優れた研究者との長い会話で感じられる。AIの哲学的な側面についての基本的な質問には困惑が浮かぶ。ダン・ワンの有名な前提——中国は弁護士ではなくエンジニアによって運営されている——を引用した研究者もいた。中国にはアメリカのようなスター科学者を体系的に育てるトラックはない。
北京はまるでベイエリアのようで、競争力のあるラボが徒歩またはUberですぐの距離にある。飛行機を降りてアリババの北京キャンパスに立ち寄り、36時間でZ.ai、Moonshot AI、清華大学、美团、小米、01.aiを訪問した。Didiでの移動は簡単で、XLを選ぶとマッサージチェア付きの電気ミニバンに乗ることもある。人材戦争について研究者に尋ねると、米国と非常に似ているとのこと。研究者は転職するのが普通で、選択は現在の雰囲気に基づく。中国のLLMコミュニティは部族間の戦いではなく、エコシステムのように感じられる。オフレコードの会話では互いに敬意を払っている。すべてのラボが字节跳动のDoubaoモデルを恐れ、DeepSeekを最高の研究センスを持つラボとして尊敬している。米国では火花が飛び交うのとは対照的だ。中国の研究者はビジネス面についても肩をすくめ、自分の問題ではないと言う。
今日のAIモデル構築が興味深いのは、優秀な研究者を集めて工学の驚異を生み出すだけではない点だ。持続可能なAIビジネスのために、LLMは構築、展開、資金調達、採用の混合になっている。主要なAI企業は、資金、計算、データなどを供給する複雑なエコシステムの中に存在する。中国のラボがこれらの入力をどのように統合するかを理解することは、彼らが未来に異なる賭けをしていることを示す。
国内AI需要の初期兆候:中国のAI市場は小さいという仮説があるが、これはSaaS支出にのみ当てはまる。クラウド市場は存在する。AIへの支出がSaaS市場かクラウド市場のどちらに沿うかは未解決の質問だが、AIはクラウドに近づいているようだ。ほとんどの開発者はClaudeに夢中で、Claudeは名目上中国では禁止されているにもかかわらず、推論需要の急増が予想される。中国の技術者は実用的で謙虚であり、以前の支出習慣よりも強い。
中国企業は技術所有の考え方を持つ。多くのAIモデルは、これらのテクノロジービジネスの実用的な均衡を反映している。ByteDanceやAlibabaが尊敬され、DeepSeekは技術リーダーだが市場リーダーではない。美团やAnt Groupのような企業が自らモデルを構築するのは、LLMが将来の製品に不可欠だからだ。彼らは強力な汎用モデルを微調整し、内部で使用する。「オープンファースト」の考え方は実用性に基づいている。
政府の支援は存在するが、その規模は不明瞭だ。中央政府が技術的な決定に影響を与えている兆候はない。データ産業は未発達で、多くのラボは社内で環境を構築している。Nvidiaチップへの渇望は強く、Huaweiチップは推論に使用されている。
これらの点は、米国のラボの運用を中国に単純にマッピングできないことを示している。重要な質問は、これらの異なるエコシステムが本質的に異なるモデルを生み出すかどうかだ。
私は中国についてほとんど知らないまま旅に出て、学び始めたばかりだと感じて帰ってきた。中国はルールやレシピで表現できる場所ではなく、非常に異なるダイナミクスと化学を持つ。文化は古く、深く、国内のテクノロジー構築と完全に絡み合っている。
米国の現在の権力構造の多くは、中国に対する世界観を意思決定の重要な道具として使用している。中国の主要なAIラボのほとんどと直接話した後、中国には米国の意思決定ではモデル化が難しい多くの性質と本能があることがわかった。これらのラボがなぜトップモデルをオープンにリリースするのか、所有権の考え方とエコシステム支援の交差点は私には理解しにくい。
中国のラボは実用的であり、必ずしもオープンソースの絶対主義者ではないが、開発者とエコシステムを支援し、モデルについて学ぶための手段としてオープン性を重視している。ほとんどすべての主要な中国テクノロジー企業が独自の汎用LLMを構築している。これは、自らのスタックを制御し、最も重要な技術を開発したいという深い願望を反映している。ノートパソコンから顔を上げると、常に空にクレーンが見える。これは中国の構築文化とエネルギーに合致している。
中国の研究者の人間性、魅力、温かさは非常に人間味を帯びている。個人的なレベルでは、米国で一般的な地政学的な対話は彼らに浸透していない。世界はこの単純なポジティブさをもっと必要としている。AIコミュニティの一員として、現在は国籍のラベルをめぐる亀裂をより心配している。
米国のラボがAIスタックのすべての部分で明確なリーダーであり続けることを望んでいるが、同時にグローバルなオープンエコシステムの繁栄も望んでいる。それはより安全で、アクセスしやすく、有用なAIを生み出すからだ。執筆時点で、オープンモデルに影響を与える大統領令の噂が広がっており、米国のリーダーシップとグローバルエコシステムの相乗効果を複雑にしている。