2026-05-07 23:42 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

来自中国AI实验室的笔记

通过对中国主要AI实验室的访问，作者发现了一种谦逊、务实、快速跟进的文化。中国研究人员（其中许多是学生）专注于模型构建而非哲学辩论，较少自我意识。生态系统显示出早期国内AI需求，但数据产业欠发达，且对Nvidia芯片有强烈渴求。

来源Interconnects (Nathan Lambert)作者: Nathan Lambert

乘坐从杭州到上海的高速列车，窗外掠过山脊线上的风能发电机和夕阳下的摩天楼。这次中国之行让我深感谦卑，因为我在陌生的地方受到了热情的欢迎。我有幸与许多之前仅从远处了解的AI生态系统人士会面，他们的笑容让我意识到我的工作和AI生态系统的全球性。

中国构建语言模型的公司是完美的快速追随者，建立在长期的文化传统之上，并采用了不同的技术公司构建方式。从输出和成分看，中美实验室相似，但组织方式存在持久差异。中国实验室擅长追赶前沿，部分原因是文化上的契合。与谦逊、开放的研究人员交谈后，我更加确信这一点。

构建最佳LLM需要整个堆栈的细致工作，从数据到架构细节和RL算法实现。所有点都可能带来改进，但整合是一个复杂过程，有时需要搁置个别天才的工作以优化整体。美国研究人员同样出色，但美国文化强调自我推销，导致冲突。而中国实验室中，核心贡献者中有大量活跃学生，他们被视为同伴，这与美国顶级实验室不同，后者很少提供实习机会。

文化差异带来的优势包括：更愿意做非炫酷但能提升模型的工作；新人能更快适应新技术；较少的自我意识使组织规模更容易扩展；以及丰富的人才适合解决已有验证的问题。这种倾向与公认的刻板印象——中国研究人员较少产生开创性学术研究——形成对比。一些学术实验室正在培养更具雄心的研究文化，但部分技术领袖怀疑短期能否实现，因为这需要改革教育和激励系统。

学生们以全新的眼光看待LLM，快速吸收大量背景知识。他们谦逊地放下预设，全身心投入改进模型。他们直率且不受哲学讨论干扰，更关心构建最佳模型。当被问及经济或社会风险时，他们往往感到困惑，因为这超出了他们的关注范围。这种差异在一场对话中体现：一位研究者引用Dan Wang的说法，认为中国由工程师管理，而美国由律师管理，强调他们的构建愿望。中国缺乏像美国那样的明星科学家成长轨道。

北京与湾区相似，竞争激烈的实验室咫尺之遥。36小时内我们走访了Z.ai、Moonshot AI、清华大学、美团、小米和01.ai等。滴滴出行方便，有时还能坐到带按摩椅的电动面包车。人才争夺战与美国类似，研究人员会跳槽，选择基于当前氛围。中国LLM社区更像一个生态系统而非敌对部落。所有实验室都害怕字节跳动的豆包模型，同时尊重DeepSeek的研究品味。相比美国，中国研究人员在商业问题上更谦逊，认为那不是他们的职责。

构建AI模型不再仅仅是聚集优秀研究人员产生工程奇迹。为了维持AI业务，LLM涉及构建、部署、融资和采用。中国实验室对这些输入整合的思考方式不同。早期迹象显示国内AI需求，尽管有人认为中国公司不习惯为软件付费。然而，许多开发者痴迷于Claude，尽管它名义上被禁。中国技术人员务实、谦逊，这比任何习惯都强。他们还拥有技术自有心态：像美团和小米这样的公司构建LLM是为了控制自身技术栈，而非追赶时髦。政府帮助存在但模糊，似乎主要是减少官僚障碍，而非影响技术决策。数据行业欠发达，许多实验室选择自建环境。Nvidia芯片仍是黄金标准，华为芯片常用于推理。

这次旅行让我意识到中国无法用规则概括，其文化深刻影响技术构建。美国决策者需要理解中国的这些特质。中国实验室务实而非开源意识形态，但有意支持开发者生态。几乎所有主要科技公司都在构建通用LLM，这反映了对控制自身技术栈的渴望。中国研究人员的热情和人性化令人感动。我希望美国实验室在AI堆栈的每个部分保持领先，同时全球开源生态繁荣。但关于行政命令的传言让我担忧。