AI News HubLIVE
站內改寫2 分鐘閱讀

為什麼你的下一個偉大創意不會來自LLM

儘管LLM在日常編碼、研究和寫作中非常有用,但它們本質上無法創造真正的全新想法。文章從機制和規模兩個角度論證:LLM透過下一個詞預測在已有思想的凸包內插值,無法產生突破性創新;同時,早期資訊壓縮流程(如LLM Wiki模式)會導致不可逆的資訊損失和錯誤級聯。最終結論是LLM是現有知識的導航工具,而非創意生成器。

來源Hacker News AI作者: speckx

我們日常大量使用大語言模型(LLM)進行程式設計、研究和寫作,它們確實非常有用,甚至在某些方面效果驚人。但本文作者提出一個核心觀點:LLM無法創造真正全新的想法。

從機制上看,LLM的本質是下一個詞預測,從訓練語料庫擬合的分佈中取樣。模型沒有超越文本編碼的推理能力,它儲存的是token序列上的高維插值函式。雖然可以對不在訓練集中的輸入產生輸出,但這只是內插,而非外推。真正的好創意——例如顛覆性突破——往往違反語料庫所編碼的規律,因此在模型的分佈中機率極低。模型無法區分“因真實而新穎的低機率”和“因錯誤而低機率”,它唯一能判斷的“好”是高機率,即“與已有想法相似”。這本質上與真正的新穎性負相關。

從規模上看,如果LLM能夠透過組合不同領域的知識產生突破,那麼當前每天數百萬次的LLM使用應該已經產生了許多新穎想法。然而,我們看到的是大量插值性質的新穎(重述、綜合、將已知方法遷移到鄰近問題),而外推性質的新穎(根本性突破、真正的新想法)幾乎不存在。這種雙峰分佈正是機制預測的結果:在密度高的區域(已知點之間)豐富,在密度低的區域(之外)缺失。相關研究也支援:Chakrabarty等人(2025)發現LLM產生的想法導致跨領域的同質化;Tian等人(2025)顯示對齊的LLM被困在RLHF形成的“安全吸引子盆地”中。

文章進一步討論了資訊處理流水線中的問題。以Karpathy的LLM Wiki模式為例,在攝入階段就將原始資料編譯成結構化的知識圖譜,這在任何問題被提出之前就做出了不可逆的選擇,導致大量資訊丟失。資訊理論中的資料加工不等式表明:資料處理只能破壞資訊,不能創造資訊。每一步流水線只會丟失或保持資訊,永遠不會增加。早期扁平化處理(如節點-邊圖)只保留了圖形式的資訊,而論證結構、證據權重、推理鏈條等都被丟棄。對於需要高質量推理的領域(如醫學研究、法律分析、政策決策),這種早期資訊丟失是致命的。此外,級聯的機器學習系統會累積“技術債務”,每一步的錯誤成為下一步的訓練訊號,形成難以檢測的反饋迴圈。系統越複雜,表面看起來越權威,但實際上可靠性越差。

正確的做法是儘可能晚地、在獲得足夠資訊後再進行資訊剪裁。剪裁應發生在查詢時,由具體問題決定丟棄什麼。

總而言之,LLM是現有知識的導航工具,而非思想生成器。它們能高效執行凸包內的任務(如寫程式碼、合成研究、起草文件),但無法觸及凸包邊界之外的領域。LLM是一種“平衡化器”:它將低於平均水平的人提升,但同時也將高於平均水平或思考方式獨特的人拉回常規。最終效果是向平均值收斂,所有輸出聽起來越來越相似。使用LLM構建系統時,應誠實認識其能力邊界,不要期望它們能產生下一個偉大創意。