AI News HubLIVE
站内改写2 分钟阅读

来自中国AI实验室的笔记

通过对中国主要AI实验室的访问,作者发现了一种谦逊、务实、快速跟进的文化。中国研究人员(其中许多是学生)专注于模型构建而非哲学辩论,较少自我意识。生态系统显示出早期国内AI需求,但数据产业欠发达,且对Nvidia芯片有强烈渴求。

来源Interconnects (Nathan Lambert)作者: Nathan Lambert

乘坐从杭州到上海的高速列车,窗外掠过山脊线上的风能发电机和夕阳下的摩天楼。这次中国之行让我深感谦卑,因为我在陌生的地方受到了热情的欢迎。我有幸与许多之前仅从远处了解的AI生态系统人士会面,他们的笑容让我意识到我的工作和AI生态系统的全球性。

中国构建语言模型的公司是完美的快速追随者,建立在长期的文化传统之上,并采用了不同的技术公司构建方式。从输出和成分看,中美实验室相似,但组织方式存在持久差异。中国实验室擅长追赶前沿,部分原因是文化上的契合。与谦逊、开放的研究人员交谈后,我更加确信这一点。

构建最佳LLM需要整个堆栈的细致工作,从数据到架构细节和RL算法实现。所有点都可能带来改进,但整合是一个复杂过程,有时需要搁置个别天才的工作以优化整体。美国研究人员同样出色,但美国文化强调自我推销,导致冲突。而中国实验室中,核心贡献者中有大量活跃学生,他们被视为同伴,这与美国顶级实验室不同,后者很少提供实习机会。

文化差异带来的优势包括:更愿意做非炫酷但能提升模型的工作;新人能更快适应新技术;较少的自我意识使组织规模更容易扩展;以及丰富的人才适合解决已有验证的问题。这种倾向与公认的刻板印象——中国研究人员较少产生开创性学术研究——形成对比。一些学术实验室正在培养更具雄心的研究文化,但部分技术领袖怀疑短期能否实现,因为这需要改革教育和激励系统。

学生们以全新的眼光看待LLM,快速吸收大量背景知识。他们谦逊地放下预设,全身心投入改进模型。他们直率且不受哲学讨论干扰,更关心构建最佳模型。当被问及经济或社会风险时,他们往往感到困惑,因为这超出了他们的关注范围。这种差异在一场对话中体现:一位研究者引用Dan Wang的说法,认为中国由工程师管理,而美国由律师管理,强调他们的构建愿望。中国缺乏像美国那样的明星科学家成长轨道。

北京与湾区相似,竞争激烈的实验室咫尺之遥。36小时内我们走访了Z.ai、Moonshot AI、清华大学、美团、小米和01.ai等。滴滴出行方便,有时还能坐到带按摩椅的电动面包车。人才争夺战与美国类似,研究人员会跳槽,选择基于当前氛围。中国LLM社区更像一个生态系统而非敌对部落。所有实验室都害怕字节跳动的豆包模型,同时尊重DeepSeek的研究品味。相比美国,中国研究人员在商业问题上更谦逊,认为那不是他们的职责。

构建AI模型不再仅仅是聚集优秀研究人员产生工程奇迹。为了维持AI业务,LLM涉及构建、部署、融资和采用。中国实验室对这些输入整合的思考方式不同。早期迹象显示国内AI需求,尽管有人认为中国公司不习惯为软件付费。然而,许多开发者痴迷于Claude,尽管它名义上被禁。中国技术人员务实、谦逊,这比任何习惯都强。他们还拥有技术自有心态:像美团和小米这样的公司构建LLM是为了控制自身技术栈,而非追赶时髦。政府帮助存在但模糊,似乎主要是减少官僚障碍,而非影响技术决策。数据行业欠发达,许多实验室选择自建环境。Nvidia芯片仍是黄金标准,华为芯片常用于推理。

这次旅行让我意识到中国无法用规则概括,其文化深刻影响技术构建。美国决策者需要理解中国的这些特质。中国实验室务实而非开源意识形态,但有意支持开发者生态。几乎所有主要科技公司都在构建通用LLM,这反映了对控制自身技术栈的渴望。中国研究人员的热情和人性化令人感动。我希望美国实验室在AI堆栈的每个部分保持领先,同时全球开源生态繁荣。但关于行政命令的传言让我担忧。