2026-06-27 20:52 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 21:20 UTC+8

為什麼你的下一個偉大創意不會來自LLM

儘管LLM在日常編碼、研究和寫作中非常有用，但它們本質上無法創造真正的全新想法。文章從機制和規模兩個角度論證：LLM透過下一個詞預測在已有思想的凸包內插值，無法產生突破性創新；同時，早期資訊壓縮流程（如LLM Wiki模式）會導致不可逆的資訊損失和錯誤級聯。最終結論是LLM是現有知識的導航工具，而非創意生成器。

來源Hacker News AI作者: speckx

我們日常大量使用大語言模型（LLM）進行程式設計、研究和寫作，它們確實非常有用，甚至在某些方面效果驚人。但本文作者提出一個核心觀點：LLM無法創造真正全新的想法。

從機制上看，LLM的本質是下一個詞預測，從訓練語料庫擬合的分佈中取樣。模型沒有超越文本編碼的推理能力，它儲存的是token序列上的高維插值函式。雖然可以對不在訓練集中的輸入產生輸出，但這只是內插，而非外推。真正的好創意——例如顛覆性突破——往往違反語料庫所編碼的規律，因此在模型的分佈中機率極低。模型無法區分“因真實而新穎的低機率”和“因錯誤而低機率”，它唯一能判斷的“好”是高機率，即“與已有想法相似”。這本質上與真正的新穎性負相關。

從規模上看，如果LLM能夠透過組合不同領域的知識產生突破，那麼當前每天數百萬次的LLM使用應該已經產生了許多新穎想法。然而，我們看到的是大量插值性質的新穎（重述、綜合、將已知方法遷移到鄰近問題），而外推性質的新穎（根本性突破、真正的新想法）幾乎不存在。這種雙峰分佈正是機制預測的結果：在密度高的區域（已知點之間）豐富，在密度低的區域（之外）缺失。相關研究也支援：Chakrabarty等人（2025）發現LLM產生的想法導致跨領域的同質化；Tian等人（2025）顯示對齊的LLM被困在RLHF形成的“安全吸引子盆地”中。

文章進一步討論了資訊處理流水線中的問題。以Karpathy的LLM Wiki模式為例，在攝入階段就將原始資料編譯成結構化的知識圖譜，這在任何問題被提出之前就做出了不可逆的選擇，導致大量資訊丟失。資訊理論中的資料加工不等式表明：資料處理只能破壞資訊，不能創造資訊。每一步流水線只會丟失或保持資訊，永遠不會增加。早期扁平化處理（如節點-邊圖）只保留了圖形式的資訊，而論證結構、證據權重、推理鏈條等都被丟棄。對於需要高質量推理的領域（如醫學研究、法律分析、政策決策），這種早期資訊丟失是致命的。此外，級聯的機器學習系統會累積“技術債務”，每一步的錯誤成為下一步的訓練訊號，形成難以檢測的反饋迴圈。系統越複雜，表面看起來越權威，但實際上可靠性越差。

正確的做法是儘可能晚地、在獲得足夠資訊後再進行資訊剪裁。剪裁應發生在查詢時，由具體問題決定丟棄什麼。

總而言之，LLM是現有知識的導航工具，而非思想生成器。它們能高效執行凸包內的任務（如寫程式碼、合成研究、起草文件），但無法觸及凸包邊界之外的領域。LLM是一種“平衡化器”：它將低於平均水平的人提升，但同時也將高於平均水平或思考方式獨特的人拉回常規。最終效果是向平均值收斂，所有輸出聽起來越來越相似。使用LLM構建系統時，應誠實認識其能力邊界，不要期望它們能產生下一個偉大創意。