2026-05-15 04:01 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

神經網路內的幾何計算器

研究發現，Llama 3.1 8B 模型內部存在一個通用加法模組，利用圓形表示（傅立葉特徵）對數字進行編碼和加法計算，並將其複用至月份、星期等迴圈概念的推理任務中。該模組位於第18層，透過平行計算各模數的和來實現加法，並透過引導實驗證實了其因果作用。

來源Hacker News AI作者: guybedo

研究人員在一項新的研究中發現，開源大語言模型 Llama 3.1 8B 內部隱藏著一個通用的“加法模組”，它利用一種看似奇特卻極為高效的幾何機制來執行加法運算。這項發現不僅揭示了神經網路處理數值推理的內部工作原理，也為理解模型的行為和泛化能力提供了新的視角。

該加法模組位於模型的第18層。研究團隊透過追蹤資訊在層與層之間的流動，並採用因果乾預方法證實，這一模組不僅用於處理純數字加法（如“7+9”），還能處理涉及迴圈概念的推理，例如“八個月後的月份”或“週五之後的兩天”。這種跨任務的重用是模型在引數有限的情況下最佳化資源分配的結果。

那麼，神經網路是如何表示數字的呢？研究發現，Llama 模型並不像人類或傳統計算機那樣使用線性數軸或二進位制編碼，而是採用一組“圓形”表示。每一個數字被編碼為在多個不同模數（例如2、5、10、100）下的餘數，這些餘數對應啟用空間中的圓形特徵。這種表示方式類似於數學上的傅立葉分解，允許模型以模組化的方式處理資訊。

加法模組的工作方式是將大問題分解為許多小問題並行求解。對於每個模數圓，模組只需要計算該模數下的和。例如，計算“6+8”時，模組分別計算 (6 mod 2)+(8 mod 2)=0、(6 mod 5)+(8 mod 5)=4、(6 mod 10)+(8 mod 10)=4，等等。最終，這些模數結果共同確定了總和14。研究人員透過視覺化工具展示了模型在計算過程中各模數圓上的實際啟用情況，提供了強有力的相關性證據。

為了進一步證明該模組的因果作用，研究團隊採用了“引導”（steering）技術：透過人為調整加法模組中所有圓形特徵的強度，觀察模型對後續單詞預測的改變。結果表明，操控這些圓形特徵可以直接改變模型輸出的月份，從而證實了該計算模組的真實性和功能。此外，單個神經元的啟用模式也顯示出清晰的分工：有些神經元專門負責模2子問題，有些負責模5，依此類推。

這項研究最重要的啟示是：神經網路不僅儲存幾何化的概念表徵，還利用這些表徵進行實際計算。加法模組只是一個例子，團隊正在開發能夠自動發現這類機制的方法。理解這些機制對於除錯、控制以及設計更先進的AI系統至關重要。正如研究者所言：“如果我們要理解模型行為、控制它、除錯它並最終設計更好的模型，我們就需要同時理解模型構建的表徵以及在這些表徵上執行的計算。”