2026-05-07 23:42 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

來自中國AI實驗室的筆記

通過對中國主要AI實驗室的訪問，作者發現了一種謙遜、務實、快速跟進的文化。中國研究人員（其中許多是學生）專注於模型構建而非哲學辯論，較少自我意識。生態系統顯示出早期國內AI需求，但數據產業欠發達，且對Nvidia芯片有強烈渴求。

來源Interconnects (Nathan Lambert)作者: Nathan Lambert

乘坐從杭州到上海的高速列車，窗外掠過山脊線上的風能發電機和夕陽下的摩天樓。這次中國之行讓我深感謙卑，因為我在陌生的地方受到了熱情的歡迎。我有幸與許多之前僅從遠處瞭解的AI生態系統人士會面，他們的笑容讓我意識到我的工作和AI生態系統的全球性。

中國構建語言模型的公司是完美的快速追隨者，建立在長期的文化傳統之上，並採用了不同的技術公司構建方式。從輸出和成分看，中美實驗室相似，但組織方式存在持久差異。中國實驗室擅長追趕前沿，部分原因是文化上的契合。與謙遜、開放的研究人員交談後，我更加確信這一點。

構建最佳LLM需要整個堆棧的細緻工作，從數據到架構細節和RL算法實現。所有點都可能帶來改進，但整合是一個複雜過程，有時需要擱置個別天才的工作以優化整體。美國研究人員同樣出色，但美國文化強調自我推銷，導致衝突。而中國實驗室中，核心貢獻者中有大量活躍學生，他們被視為同伴，這與美國頂級實驗室不同，後者很少提供實習機會。

文化差異帶來的優勢包括：更願意做非炫酷但能提升模型的工作；新人能更快適應新技術；較少的自我意識使組織規模更容易擴展；以及豐富的人才適合解決已有驗證的問題。這種傾向與公認的刻板印象——中國研究人員較少產生開創性學術研究——形成對比。一些學術實驗室正在培養更具雄心的研究文化，但部分技術領袖懷疑短期能否實現，因為這需要改革教育和激勵系統。

學生們以全新的眼光看待LLM，快速吸收大量背景知識。他們謙遜地放下預設，全身心投入改進模型。他們直率且不受哲學討論干擾，更關心構建最佳模型。當被問及經濟或社會風險時，他們往往感到困惑，因為這超出了他們的關注範圍。這種差異在一場對話中體現：一位研究者引用Dan Wang的説法，認為中國由工程師管理，而美國由律師管理，強調他們的構建願望。中國缺乏像美國那樣的明星科學家成長軌道。

北京與灣區相似，競爭激烈的實驗室咫尺之遙。36小時內我們走訪了Z.ai、Moonshot AI、清華大學、美團、小米和01.ai等。滴滴出行方便，有時還能坐到帶按摩椅的電動麪包車。人才爭奪戰與美國類似，研究人員會跳槽，選擇基於當前氛圍。中國LLM社區更像一個生態系統而非敵對部落。所有實驗室都害怕字節跳動的豆包模型，同時尊重DeepSeek的研究品味。相比美國，中國研究人員在商業問題上更謙遜，認為那不是他們的職責。

構建AI模型不再僅僅是聚集優秀研究人員產生工程奇蹟。為了維持AI業務，LLM涉及構建、部署、融資和採用。中國實驗室對這些輸入整合的思考方式不同。早期跡象顯示國內AI需求，儘管有人認為中國公司不習慣為軟件付費。然而，許多開發者痴迷於Claude，儘管它名義上被禁。中國技術人員務實、謙遜，這比任何習慣都強。他們還擁有技術自有心態：像美團和小米這樣的公司構建LLM是為了控制自身技術棧，而非追趕時髦。政府幫助存在但模糊，似乎主要是減少官僚障礙，而非影響技術決策。數據行業欠發達，許多實驗室選擇自建環境。Nvidia芯片仍是黃金標準，華為芯片常用於推理。

這次旅行讓我意識到中國無法用規則概括，其文化深刻影響技術構建。美國決策者需要理解中國的這些特質。中國實驗室務實而非開源意識形態，但有意支持開發者生態。幾乎所有主要科技公司都在構建通用LLM，這反映了對控制自身技術棧的渴望。中國研究人員的熱情和人性化令人感動。我希望美國實驗室在AI堆棧的每個部分保持領先，同時全球開源生態繁榮。但關於行政命令的傳言讓我擔憂。