來自中國AI實驗室的筆記
通過對中國主要AI實驗室的訪問,作者發現了一種謙遜、務實、快速跟進的文化。中國研究人員(其中許多是學生)專注於模型構建而非哲學辯論,較少自我意識。生態系統顯示出早期國內AI需求,但數據產業欠發達,且對Nvidia芯片有強烈渴求。
乘坐從杭州到上海的高速列車,窗外掠過山脊線上的風能發電機和夕陽下的摩天樓。這次中國之行讓我深感謙卑,因為我在陌生的地方受到了熱情的歡迎。我有幸與許多之前僅從遠處瞭解的AI生態系統人士會面,他們的笑容讓我意識到我的工作和AI生態系統的全球性。
中國構建語言模型的公司是完美的快速追隨者,建立在長期的文化傳統之上,並採用了不同的技術公司構建方式。從輸出和成分看,中美實驗室相似,但組織方式存在持久差異。中國實驗室擅長追趕前沿,部分原因是文化上的契合。與謙遜、開放的研究人員交談後,我更加確信這一點。
構建最佳LLM需要整個堆棧的細緻工作,從數據到架構細節和RL算法實現。所有點都可能帶來改進,但整合是一個複雜過程,有時需要擱置個別天才的工作以優化整體。美國研究人員同樣出色,但美國文化強調自我推銷,導致衝突。而中國實驗室中,核心貢獻者中有大量活躍學生,他們被視為同伴,這與美國頂級實驗室不同,後者很少提供實習機會。
文化差異帶來的優勢包括:更願意做非炫酷但能提升模型的工作;新人能更快適應新技術;較少的自我意識使組織規模更容易擴展;以及豐富的人才適合解決已有驗證的問題。這種傾向與公認的刻板印象——中國研究人員較少產生開創性學術研究——形成對比。一些學術實驗室正在培養更具雄心的研究文化,但部分技術領袖懷疑短期能否實現,因為這需要改革教育和激勵系統。
學生們以全新的眼光看待LLM,快速吸收大量背景知識。他們謙遜地放下預設,全身心投入改進模型。他們直率且不受哲學討論干擾,更關心構建最佳模型。當被問及經濟或社會風險時,他們往往感到困惑,因為這超出了他們的關注範圍。這種差異在一場對話中體現:一位研究者引用Dan Wang的説法,認為中國由工程師管理,而美國由律師管理,強調他們的構建願望。中國缺乏像美國那樣的明星科學家成長軌道。
北京與灣區相似,競爭激烈的實驗室咫尺之遙。36小時內我們走訪了Z.ai、Moonshot AI、清華大學、美團、小米和01.ai等。滴滴出行方便,有時還能坐到帶按摩椅的電動麪包車。人才爭奪戰與美國類似,研究人員會跳槽,選擇基於當前氛圍。中國LLM社區更像一個生態系統而非敵對部落。所有實驗室都害怕字節跳動的豆包模型,同時尊重DeepSeek的研究品味。相比美國,中國研究人員在商業問題上更謙遜,認為那不是他們的職責。
構建AI模型不再僅僅是聚集優秀研究人員產生工程奇蹟。為了維持AI業務,LLM涉及構建、部署、融資和採用。中國實驗室對這些輸入整合的思考方式不同。早期跡象顯示國內AI需求,儘管有人認為中國公司不習慣為軟件付費。然而,許多開發者痴迷於Claude,儘管它名義上被禁。中國技術人員務實、謙遜,這比任何習慣都強。他們還擁有技術自有心態:像美團和小米這樣的公司構建LLM是為了控制自身技術棧,而非追趕時髦。政府幫助存在但模糊,似乎主要是減少官僚障礙,而非影響技術決策。數據行業欠發達,許多實驗室選擇自建環境。Nvidia芯片仍是黃金標準,華為芯片常用於推理。
這次旅行讓我意識到中國無法用規則概括,其文化深刻影響技術構建。美國決策者需要理解中國的這些特質。中國實驗室務實而非開源意識形態,但有意支持開發者生態。幾乎所有主要科技公司都在構建通用LLM,這反映了對控制自身技術棧的渴望。中國研究人員的熱情和人性化令人感動。我希望美國實驗室在AI堆棧的每個部分保持領先,同時全球開源生態繁榮。但關於行政命令的傳言讓我擔憂。