2026-06-27 20:52 UTC+8站内改写2 分钟阅读更新: 2026-06-27 21:20 UTC+8

为什么你的下一个伟大创意不会来自LLM

尽管LLM在日常编码、研究和写作中非常有用，但它们本质上无法创造真正的全新想法。文章从机制和规模两个角度论证：LLM通过下一个词预测在已有思想的凸包内插值，无法产生突破性创新；同时，早期信息压缩流程（如LLM Wiki模式）会导致不可逆的信息损失和错误级联。最终结论是LLM是现有知识的导航工具，而非创意生成器。

来源Hacker News AI作者: speckx

我们日常大量使用大语言模型（LLM）进行编程、研究和写作，它们确实非常有用，甚至在某些方面效果惊人。但本文作者提出一个核心观点：LLM无法创造真正全新的想法。

从机制上看，LLM的本质是下一个词预测，从训练语料库拟合的分布中采样。模型没有超越文本编码的推理能力，它存储的是token序列上的高维插值函数。虽然可以对不在训练集中的输入产生输出，但这只是内插，而非外推。真正的好创意——例如颠覆性突破——往往违反语料库所编码的规律，因此在模型的分布中概率极低。模型无法区分“因真实而新颖的低概率”和“因错误而低概率”，它唯一能判断的“好”是高概率，即“与已有想法相似”。这本质上与真正的新颖性负相关。

从规模上看，如果LLM能够通过组合不同领域的知识产生突破，那么当前每天数百万次的LLM使用应该已经产生了许多新颖想法。然而，我们看到的是大量插值性质的新颖（重述、综合、将已知方法迁移到邻近问题），而外推性质的新颖（根本性突破、真正的新想法）几乎不存在。这种双峰分布正是机制预测的结果：在密度高的区域（已知点之间）丰富，在密度低的区域（之外）缺失。相关研究也支持：Chakrabarty等人（2025）发现LLM产生的想法导致跨领域的同质化；Tian等人（2025）显示对齐的LLM被困在RLHF形成的“安全吸引子盆地”中。

文章进一步讨论了信息处理流水线中的问题。以Karpathy的LLM Wiki模式为例，在摄入阶段就将原始资料编译成结构化的知识图谱，这在任何问题被提出之前就做出了不可逆的选择，导致大量信息丢失。信息论中的数据加工不等式表明：数据处理只能破坏信息，不能创造信息。每一步流水线只会丢失或保持信息，永远不会增加。早期扁平化处理（如节点-边图）只保留了图形式的信息，而论证结构、证据权重、推理链条等都被丢弃。对于需要高质量推理的领域（如医学研究、法律分析、政策决策），这种早期信息丢失是致命的。此外，级联的机器学习系统会累积“技术债务”，每一步的错误成为下一步的训练信号，形成难以检测的反馈循环。系统越复杂，表面看起来越权威，但实际上可靠性越差。

正确的做法是尽可能晚地、在获得足够信息后再进行信息剪裁。剪裁应发生在查询时，由具体问题决定丢弃什么。

总而言之，LLM是现有知识的导航工具，而非思想生成器。它们能高效执行凸包内的任务（如写代码、合成研究、起草文档），但无法触及凸包边界之外的领域。LLM是一种“平衡化器”：它将低于平均水平的人提升，但同时也将高于平均水平或思考方式独特的人拉回常规。最终效果是向平均值收敛，所有输出听起来越来越相似。使用LLM构建系统时，应诚实认识其能力边界，不要期望它们能产生下一个伟大创意。