AI News HubLIVE
站内改写2 分钟阅读

为什么你的下一个伟大创意不会来自LLM

尽管LLM在日常编码、研究和写作中非常有用,但它们本质上无法创造真正的全新想法。文章从机制和规模两个角度论证:LLM通过下一个词预测在已有思想的凸包内插值,无法产生突破性创新;同时,早期信息压缩流程(如LLM Wiki模式)会导致不可逆的信息损失和错误级联。最终结论是LLM是现有知识的导航工具,而非创意生成器。

来源Hacker News AI作者: speckx

我们日常大量使用大语言模型(LLM)进行编程、研究和写作,它们确实非常有用,甚至在某些方面效果惊人。但本文作者提出一个核心观点:LLM无法创造真正全新的想法。

从机制上看,LLM的本质是下一个词预测,从训练语料库拟合的分布中采样。模型没有超越文本编码的推理能力,它存储的是token序列上的高维插值函数。虽然可以对不在训练集中的输入产生输出,但这只是内插,而非外推。真正的好创意——例如颠覆性突破——往往违反语料库所编码的规律,因此在模型的分布中概率极低。模型无法区分“因真实而新颖的低概率”和“因错误而低概率”,它唯一能判断的“好”是高概率,即“与已有想法相似”。这本质上与真正的新颖性负相关。

从规模上看,如果LLM能够通过组合不同领域的知识产生突破,那么当前每天数百万次的LLM使用应该已经产生了许多新颖想法。然而,我们看到的是大量插值性质的新颖(重述、综合、将已知方法迁移到邻近问题),而外推性质的新颖(根本性突破、真正的新想法)几乎不存在。这种双峰分布正是机制预测的结果:在密度高的区域(已知点之间)丰富,在密度低的区域(之外)缺失。相关研究也支持:Chakrabarty等人(2025)发现LLM产生的想法导致跨领域的同质化;Tian等人(2025)显示对齐的LLM被困在RLHF形成的“安全吸引子盆地”中。

文章进一步讨论了信息处理流水线中的问题。以Karpathy的LLM Wiki模式为例,在摄入阶段就将原始资料编译成结构化的知识图谱,这在任何问题被提出之前就做出了不可逆的选择,导致大量信息丢失。信息论中的数据加工不等式表明:数据处理只能破坏信息,不能创造信息。每一步流水线只会丢失或保持信息,永远不会增加。早期扁平化处理(如节点-边图)只保留了图形式的信息,而论证结构、证据权重、推理链条等都被丢弃。对于需要高质量推理的领域(如医学研究、法律分析、政策决策),这种早期信息丢失是致命的。此外,级联的机器学习系统会累积“技术债务”,每一步的错误成为下一步的训练信号,形成难以检测的反馈循环。系统越复杂,表面看起来越权威,但实际上可靠性越差。

正确的做法是尽可能晚地、在获得足够信息后再进行信息剪裁。剪裁应发生在查询时,由具体问题决定丢弃什么。

总而言之,LLM是现有知识的导航工具,而非思想生成器。它们能高效执行凸包内的任务(如写代码、合成研究、起草文档),但无法触及凸包边界之外的领域。LLM是一种“平衡化器”:它将低于平均水平的人提升,但同时也将高于平均水平或思考方式独特的人拉回常规。最终效果是向平均值收敛,所有输出听起来越来越相似。使用LLM构建系统时,应诚实认识其能力边界,不要期望它们能产生下一个伟大创意。