AI News HubLIVE
站内改写

所有實驗室都怕字節,所有人都在誇DeepSeek!美國研究員36小時中國AI行

艾倫研究所研究員Nathan Lambert的中國之行揭示了中美AI文化的巨大差異。中國實驗室強調合作,學生深度參與,開源文化盛行,而美國實驗室則陷入內鬥和明星文化。

文章情報

工程師進階

要點

  • 中國AI實驗室文化更注重合作,學生直接參與核心研發。
  • 所有實驗室都對字節跳動保持警惕,但對DeepSeek一致敬佩。
  • 中國研究員對AI的社會風險不關心,專注於模型優化。
  • 中國公司普遍自研大模型並開源,體現了實用主義。

為甚麼重要

這條新聞值得關注,因為中國AI實驗室文化更注重合作,學生直接參與核心研發。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

所有實驗室都怕字節,所有人都在誇DeepSeek!美國研究員36小時中國AI行 – 量子位

首頁

資訊

智能車

智庫

活動

MEET大會

AIGC

掃碼關注量子位

-->

所有實驗室都怕字節,所有人都在誇DeepSeek!美國研究員36小時中國AI行

Jay 2026-05-08 12:15:24

來源:量子位

這跟中國的開源精神,顯然是一脈相承的

Jay 發自 凹非寺

量子位 | 公眾號 QbitAI

中國AI研究員的性格、魅力和真誠……讓人倍感親切。

這是艾倫研究所(Ai2)的研究員Nathan Lambert,在最近結束中國之行後,發自內心的一番感慨。

在Nathan眼裏,國內的LLM圈子簡直是天堂,大家彼此尊重、即便立場不同也客客氣氣的。

反觀大洋彼岸的御三家,他突然有點沒眼看。

天天激情互噴,跟部落爭霸似的……

並非場面客套話。

這次來中國的36小時,Nathan幾乎把國內AI圈打卡了個遍,月之暗面、智譜、清華、美團、小米、千問……都有深度交流。

在和大量一線AI研究員、學生聊完天后,Nathan得出了這個結論:

這裏的AI玩家,在合作共贏。

基於此,Nathan寫下長文,分享了他此次中國行期間令他印象深刻的種種事蹟——

所有實驗室都有點怕字節,所有人都敬佩DeepSeek。

北京簡直跟硅谷一樣,他36小時內跑了6家AI公司。

他問一名中國研究員對AI風險的看法,對方困惑地愣住了——這似乎是個不合適的問題。

美團、小米這種公司也會自研大模型,這在中國是理所當然的事。

從筆記本上抬起頭,總能看到地平線上的起重機,彷彿中國工程師文化的一種具象化。

實在太真誠了,連MiniMax都跑來前排圍觀,表示希望下次Nathan的「中國行」能把上海和深圳也安排上。

以下是整理後的文章節選。

Enjoy。

中國研究員的心態

Nathan在文中花了大篇幅聊一個事:為什麼中國實驗室這麼擅長追趕前沿?

他的核心判斷是,文化。

今天做一個好的LLM,靠的是從數據到架構到RL算法,全棧每個細節的打磨。每個環節都能榨出一些提升,但怎麼把這些提升拼到一起,是一個極其複雜的多目標優化問題。

有時候某個天才研究員的工作,需要為模型的整體工作讓路。

在美國,這種事經常引爆衝突。

Nathan透露了個瓜:Llama團隊據傳就是因為內部政治鬥爭過重而崩盤的。

大家都想讓別人按自己的想法做事,有實驗室需要花錢安撫頂級研究員,才能讓他們別再抱怨自己的想法沒被採納。

據此,他得出一個結論:

過強的Ego和野心,會妨礙做出最好的模型。

而中國這邊,他觀察到一個微妙差異:

中國實驗室的核心貢獻者有大量都是在讀學生,在這裏,學生被當成同事直接參與核心研發。

他們會願意做那些不那麼Sexy的工作,無所謂,只要能讓模型變好就行。

反觀美國呢?OpenAI、Anthropic、Cursor這些頂級公司乾脆就不開實習。

Google這類公司名義上會有和Gemini相關的實習,但事實上,大家會擔心實習生會被隔離在邊緣區域,接觸不到核心工作。

但中國經驗證明,學生的參與,反而能大幅加快行進速度。

除此之外,這些學生還帶來了一個意想不到的優勢:全新的視角。

過去幾年LLM的關鍵範式從Scaling MoE,到Scaling RL,再到Agent,每一次轉換都需要瘋狂吸收新的上下文。

學生恰恰最擅長這個。他們擅長快速學習,也樂於放下一切預設,一頭扎進去。

Nathan還注意到一件有意思的事。當他問中國研究員對AI的經濟影響或長遠社會風險有什麼看法時,很多人的反應是——

愣了一下。

不是不想回答,是真的覺得不關他們事。他們的任務就是做出最好的模型,其他的事,不是他們操心的範圍。

相比之下,美國文化更強調為自己發聲。

作為科學家,你越能為自己的工作發聲,就越容易成功。

而硅谷文化也在推動一種新的成名路徑,也就是成為明星AI科學家。所以大家樂忠於上Dwarkesh、Lex Fridman這種超級播客節目。

一位研究員引用了Dan Wang那個經典説法,很精闢:中國是工程師治國,美國是律師治國。

工程師考慮的是解決問題,而律師考慮的,是定義問題。

概括一下,Nathan覺得有四點比較重要的文化差異:

1、更願意做那些不那麼光鮮,但能提升最終模型的工作。

2、剛進入AI構建領域的人,不受上一輪AI炒作週期的路徑依賴束縛,因此能更快適應新的現代技術。

3、更少的自我意識,讓組織結構能稍微更好地擴張,因為更少有人試圖鑽組織系統的空子。

4、大量人才非常適合解決那些已經在別處有概念驗證的問題。

北京=硅谷

Nathan的北京遊挺有意思。

他説北京簡直像灣區。隨便走兩步就是一個競爭對手的辦公室。

他下了飛機,去酒店的路上順便就拐進了阿里巴巴北京園區。然後在36個小時內,他依次去了智譜、月之暗面、清華、美團、小米、零一萬物。

線下交流中,他向研究員們八卦中國的人才爭奪情況怎麼樣。回答是:

跟美國差不多。

跳槽很正常,主要看當前哪個團隊氛圍最好。

但有一點跟美國很不一樣。

在中國的AI圈,實驗室之間更像是一個生態,而不是互相廝殺的部落。在很多私下交流中,大家對同行都是尊重的。

所有實驗室都對字節跳動和豆包保持高度關注,在Nathan看來,字節是中國少數走閉源路線推進的大模型玩家。

所有人都敬佩DeepSeek,認為它是研究品味最好的實驗室。

這讓Nathan很驚訝,和美國研究員的線下對話,火藥味可比這濃多了。

但在中國,大家似乎冥冥中形成了一種默契的共識。

還有一點他覺得很奇怪——

中國研究員談到商業化的時候經常聳聳肩,説:那不是我的事。

而美國這邊,從數據供應商到算力到融資,人人都對各種生態級別的產業趨勢如數家珍。

中國AI產業的真實樣貌

聊完文化,Nathan接着聊了聊產業層面他觀察到的幾個關鍵差異。我挑幾個最有意思的説。

1、國內AI需求的早期信號

一直有一種説法:中國AI市場會比較小,因為中國公司不太願意為軟件付費。Nathan認為這個判斷只對了一半。不願意花錢的部分對應的是SaaS生態,這在中國確實很小。但中國有一個龐大的雲計算市場。

關鍵問題在於:企業在AI上的花費,最終會走SaaS的路線還是雲的路線?

Nathan的感受是,AI更接近雲,而且沒有人在擔心圍繞新工具是否能長出市場。

2、中國公司的技術自研執念

為什麼美團、螞蟻集團這種公司也在自己做大模型?

西方人可能會覺得奇怪。

但在Nathan看來,中國人的邏輯是:LLM顯然會成為未來科技產品的核心,所以必須自己掌握。

不過,雖然自研,但也開源。

先訓一個通用底座,開源出去讓社區幫忙打磨,內部再微調一個版本用到自己的產品裏。

開源不是信仰,是實用主義——它能獲得社區反饋,能回饋開源生態,也能幫助他們更好地理解自己的模型。

3、算力不足

英偉達仍是訓練的黃金標準,每個實驗室都因為芯片不夠而受限。

4、數據產業不夠成熟

Nathan聽説過Anthropic和OpenAI動輒花1000萬美元以上買單個RL訓練環境,每年累計花費數億美元來推動前沿。

他很好奇,中國實驗室是不是也在從美國公司買這些環境?或者有鏡像的國內供應鏈?

答案是:有數據產業,但質量參差不齊。

所以自己做更靠譜。一般來説研究員們會親自花大量時間搭RL訓練環境,字節和阿里這種大公司則有內部數據標註團隊。

尾聲

Nathan文章最後的一段話,關乎「瞭解」。

Nathan表示,來之前就知道自己對中國瞭解甚少,走了一圈之後反而更強烈地感受到,自己根本不瞭解這塊土地。

中國不是一個能用規則或公式來概括的地方,它有完全不同的動力學和化學反應。

如此古老且深厚文化,卻又與當下的技術建設完全交織在一起。

在Nathan跟幾乎所有中國領先AI實驗室交談後,他發現中國有很多特質和直覺,是很難用西方的決策框架去建模的。

他不明白,為什麼這些實驗室要開源自己好不容易訓練出來的模型。

它們不會認為自己構建的每一個模型都必須開源,但都非常有意願支持開發者、支持生態,並且把開源進一步瞭解模型的一種方式。

這些公司構建LLM,並不是因為追逐熱點,想在新潮技術裏刷存在感。

這一切的背後,是一種Nathan沒有想過強烈的深層願望:

把技術棧掌控在自己手中。

這也讓Nathan在文章結尾,直言自己有些許焦慮:

如果説我不希望美國實驗室在AI的每個領域都保持明確領先——特別是在開源模型這塊——那我就是在騙人。

我是美國人,這是一個誠實的偏好。

我希望開源生態能在全球繁榮。這能為世界創造更安全、更可及、更有用的AI。

但現在的問題是,硅谷是否能保住這個領導地位?

歸根結底,依舊是在談中國開源文化這件事。

關於這一點,Nathan説了一句非常有畫面感的話,很適合用作結尾:

當我從筆記本電腦上抬起頭,總能看到地平線上的一簇簇起重機。

這跟中國的開源精神,顯然是一脈相承的。

Nathan報告原文: https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs

版權所有,未經授權不得以任何形式轉載及使用,違者必究。

Jay

第一批「AI原生」本科生,要畢業了2026-05-08

DeepSeek V4最大的遺憾2026-05-03

突破視覺仿真算力瓶頸!新一代具身智能仿真框架開源:高吞吐並行高保真渲染助力規模化訓練2026-05-03

銀河通用LDA定義全域數據利用範式,跨本體世界動作大模型開啓具身GPT-2時刻2026-04-29

掃碼分享至朋友圈

熱門文章

華為攜手中科大發布靈境造物,openJiuwen首發Coordination Engineering全棧支撐

2026-05-01

智譜公佈“降智”的秘密:Scaling不可避免的痛

2026-05-01

他用AI辦了個音樂節,主題:別讀博

2026-05-01

突破視覺仿真算力瓶頸!新一代具身智能仿真框架開源:高吞吐並行高保真渲染助力規模化訓練

2026-05-01

太抓馬了!馬斯克OpenAI開庭,硅谷鉅富互揭老底像極了村口吵架

2026-05-01

搜索:

搜索

-->

關於量子位

加入我們

尋求報道

商務合作

-->

掃碼關注量子位

追蹤人工智能新趨勢,報道科技行業新突破

量子位 QbitAI 版權所有©北京極客夥伴科技有限公司 京ICP備17005886號-1