专业化为何不可避免
本文从优化理论、进化生物学、竞争市场和机器学习四个角度论证了专业化是资源有限条件下系统提升性能的必然路径。作者指出,通用性并非性能优势,在有限资源下,集中资源于有限任务集比分散到无限范围更有效。文章还澄清了专业化和领域知识的区别,指出规模扩展不会改变这一根本约束。
那些关注 Dharma AI 的人已经知道,我们将专业化视为高效 AI 系统的关键原则之一,它影响着成本、性能、可靠性和自主性等方面。很少有论文像 Goldfeder、Wyder、LeCun 和 Shwartz-Ziv 在 2026 年的工作那样严谨地阐述这一观点。本文探讨并解读了《AI Must Embrace Specialization via Superhuman Adaptable Intelligence》中的思想。该论文的收敛性论证——跨越优化理论、生物学、组织经济学和机器学习——既提供了证据结构,也为后续讨论奠定了智力基础。这里的框架、组织和编辑综合是 Dharma 的成果。
传统的期望是合理的:随着 AI 系统能力增强,它们也应该变得更加通用。更强的能力和更广的适用性似乎是自然的组合——更多资源、更好方法、更广泛的训练应该产生能自信处理更多任务的系统。然而实际出现的模式不同。在任何特定领域取得最显著成果的系统,往往是那些最专注于该领域的系统。蛋白质结构预测的突破来自一个为单一科学任务设计的系统。仔细审视 AI 的历史里程碑,它们反映的是密集的领域针对性,而非通用性的扩展。
这种模式反复出现。它跨越不同领域、不同年代、以及几乎毫无共同点的架构选择。如此一致的模式暗示了一个共同原因——这个原因并非源自 AI 研究本身。
1997 年,Wolpert 和 Macready 证明了一个在 AI 架构讨论中很少提及的结果:没有任何单一的通用优化算法能在所有可能问题上胜过其他所有算法(Wolpert & Macready, 1997)。这个证明是数学的,而非哲学的。平均而言,面对学习器可能遇到的每一个可设想问题,所有算法的表现同样好——也同样差。一个算法在一个问题分布上获得优势,必然在其他分布上做出让步。性能被重新分配,而非倍增。
实际含义很直接:“算法获胜是因为它适合目标问题”(Goldfeder et al., 2026)。该定理并未说通用性不可能——它说的是通用性并非性能优势。实现超一致性表现的结构性路径是集中:用广度换取适配度。
当有限资源进入画面时,这一点变得更加清晰。任何真实系统都在约束下运行——有限的计算、有限的数据、有限的开发时间。在有限能量下,将可用资源导向学习有限任务集的方法,将胜过将相同资源分布到无限范围的方法。算术是无情的:随着任务集无界扩展,每个任务可用的资源趋向于零。在有限资源下,普遍覆盖和有意义的性能是直接冲突的。
该定理指向的结论并非通用性不好。它更狭窄、更具操作性:如论文所述,“普遍通用性是一个理论概念,但在实际中是一个神话”(Goldfeder et al., 2026)。在真实约束下幸存下来的不是试图做所有事情的系统——而是适合其目标的系统。
数学将其确立为一个预测,而非偏好。这一预测是否在优化理论之外的世界成立,是另一个问题。
另外两个领域在优化理论给出名称之前就得到了同样的预测。
如论文所述,生物学的案例是:每个生态位上的性能提升都以其他地方的成本为代价。通才拥有适应许多环境的特征,但不在任何环境中最优——能力过于分散,无法在特定条件下占主导。没有不付出代价的性能提升;投入一种能力的资源无法用于另一种能力。自然选择偏爱与局部条件匹配的设计,而非在所有可能环境中均匀覆盖的设计。生存并繁殖的有机体不是最通用的——而是最特定匹配的。经过进化时间尺度积累的结果不是通才主导——而是专家填充生态位。如论文所述:“专业化不是生物学的偶然;它是有限资源、竞争目标以及奖励一小部分进化相关挑战性能的环境的可预测结果”(Goldfeder et al., 2026)。
竞争性市场通过不同手段遵循相同的动态。未能达到性能阈值的组织和策略被淘汰——不是通过灭绝,而是通过退出、失去资金以及被更匹配的替代品取代。竞争作为一个选择机制:它放大有效策略,消除无效策略。该机制与生物选择毫无共同之处——没有遗传、没有突变、没有进化时间尺度。选择的单位不是有机体,而是组织、产品、策略。然而结构压力相同:有限资源、性能要求,以及系统性移除那些过于广泛分布而无法在关键领域卓越的实体。当性能标准明确且一致时,集中能力胜过分散能力。
进化和市场通过完全不同的机制运作——不同的时间尺度、不同的选择单位、不同的遗传机制。但两者在资源压力下产生相同的结果:适配度优先于广度。定理预测了这一点。生物学和市场独立地得出了这一点。当第三个领域通过完全不同的手段得出相同发现时,这种模式不再像是一个定理,而开始像是关于约束系统如何行为的更普遍规律。
同样的模式已在机器学习内部浮现——不是从优化理论推导而来,而是通过构建系统并观察什么改进它们的积累经验得出的。
最清晰的形式是负迁移:当系统在多个任务上训练时,由于这些任务相互竞争而非合作,导致可测量的性能下降(Ruder, 2017)。当任务共享结构时,联合训练有帮助。但当任务竞争表示容量,或在训练中施加冲突梯度时,单个任务的性能低于专用系统所能达到的水平。广度的收益变成了深度的成本。这是有限容量在相互对抗的任务间分配的可记录后果。专家不面临这种竞争,因此不付出这种成本。
前沿模型的架构提供了不同形式的证据。混合专家系统实现广度不是通过所有参数上的均匀通用性,而是通过将每个输入路由到专门的子网络——为不同任务激活不同专家。论文作者将其解读为一个结构性让步:一个旨在通用的系统通过内部恢复专业化来实现其结果。这是一个论证性的解读,而非已证明的定理——这些架构是为计算效率设计的,它们关于通用性极限的含义是合理的推断而非陈述的意图。但值得注意的是:最有能力的通用系统通过做专业系统设计上做的事情来达到其性能。
最清晰的历史例子遵循相同逻辑。AlphaFold 通过针对特定任务使用特定任务架构和训练选择,在蛋白质结构预测上实现了阶跃变化(Jumper et al., 2021)。其收益来自更窄的焦点,而非更广的覆盖。论文将 AlphaFold 作为一个典型例子——并非作为所有专用系统都能实现同等收益的证据,而是作为该机制的异常清晰说明。该机制已反复出现:论文指出,AI 里程碑的历史经常反映密集的领域针对性而非广泛能力,即使结果看起来像是通用智能的展示。
三个不同的地方。三种不同的机制。同样的发现。
如果不讨论 AI 研究中最常被引用的观察之一,这幅图景将是不完整的。Sutton 的“苦涩教训”认为,依赖领域知识的方法总是被扩展计算的方法超越(Sutton, 2019)。表面上,这似乎使专业化的论据复杂化:如果规模和通用性获胜,也许专业化只是在资源约束下有用的启发式方法,而当计算变得更便宜时,这些约束将缓解。
这一反对意见混淆了两个不同的概念。领域知识指手工编码的特征、工程化先验以及旨在使系统深入了解特定领域的规则。“苦涩教训”针对这一点——而且它是正确的。随着规模扩大,编码显式领域知识的系统已被持续超越。
领域专业化则不同:决定将系统的资源、架构和训练导向一个有限的任务集,而非广泛分布。这不是关于一个领域的知识编码。这是一个关于范围的决定。
论文精确地划出了区别:
“领域知识的有用性下降与领域专业化的有用性不同。随着缩放进展,我们将需要更少的蛋白质知识来构建一个处理蛋白质折叠的系统;然而,这样的系统仍然受益于专门关注蛋白质。”(Goldfeder et al., 2026)
缩放改变了系统可以从数据中学习的内容。它并没有改变将资源集中于有限任务集是否优于将其分布在无限范围。苦涩教训和专业化论证在不同的维度上运作——一个描述知识应如何获取,另一个描述系统应指向什么。两者可以同时为真。缩放改变了系统学习的机制;它并未解除使适配度比广度更有价值的约束。
跨越四个分析传统,同样的模式通过不同路径出现。这不是一个需要解释的巧合。这就是证据。
当有限资源遇到选择压力时——在优化问题、生态系统、市场或训练运行中——适配度始终胜过广度。具体机制不同。时间尺度不同。选择单位不同。但结构动态相同,并产生相同的结果。
定理没有在生物学中引起这种模式。生物学没有在市场中引起它。两者都没有在机器学习中引起它。它们都面临相同的底层约束:资源稀缺下的性能需要集中。定理数学上确立的,进化史上实证确认的,竞争市场通过退出代价教训的,以及机器学习系统反复展示的——都是同一件事。专业化是必然的,不是因为它是偏好,而是因为它是约束在资源有限的世界中表达的方式。