實驗室失誤可能徹底改變計算方式
研究人員在實驗中意外發現,單個CMOS電晶體可以模擬神經元和突觸的行為,這一發現可能大幅降低人工智慧的能耗。
今天,你很可能向大語言模型提問、接受LinkedIn的好友建議、觀看YouTube推薦影片,或根據Google Maps的交通預測選擇通勤路線——換句話說,你使用了人工智慧。但你可能不知道這些互動消耗了多少能源,以及背後的原因。
AI處理海量資料通常需要大型資料中心,其中配備數千個GPU,每個GPU功耗高達1000瓦——相當於一臺吸塵器或洗碗機,而且資料中心處理器全天候不間斷執行。這種低效的根本原因在於,GPU透過軟體和數十億電晶體模擬人工神經網路,需要消耗大量能量來行動數據。相比之下,人腦在執行類似AI任務時能效高出約一百萬倍。
為接近人腦的效率,神經形態工程試圖構建更接近生物神經元和突觸的電子元件。但現有方法要麼依賴不可靠的實驗性器件,要麼需要大量CMOS電晶體模擬單個神經元,限制了系統規模。而研究人員偶然發現,一個普通的CMOS電晶體——甚至不是最先進的型號——就能同時充當神經元和突觸。
2024年,一名學生在測量由電晶體和憶阻器組成的儲存電路時,忘記連線電晶體的體終端,意外觀察到電流的突然增大和滯後回線——這正是神經元的行為特徵。後續分析表明,當體終端浮空時,碰撞電離產生的空穴在襯底中積累,觸發隱藏的雙極型電晶體,產生尖銳的電流尖峰。透過控制體終端電阻,可以精確調節這一行為,實現完美的電子神經元。
更令人驚訝的是,同一器件還能用作突觸。透過調節體終端電壓,電荷被俘獲在柵介質中,改變電晶體的電導,且這種電導狀態穩定可調。研究人員將這一神經元-突觸組合稱為神經突觸隨機存取儲存器(NSRAM)。
與需要數十甚至數百個電晶體的傳統實現相比,NSRAM僅需一兩個電晶體,且完全相容現有矽製造工藝,測試中100%的器件經過1000萬次迴圈未出現故障。研究團隊已申請專利,並在《自然》雜誌發表結果。
傳統神經形態晶片儘管在音訊處理、計算機視覺等任務上已實現千倍功耗降低,但仍受限於面積和速度。NSRAM有望進一步突破這些限制。下一步,團隊需要改進計算機模型、設計外圍電路並進行系統級模擬。NSRAM技術首先適用於邊緣AI任務,如提升電池供電裝置的智慧水平;若成功擴充套件,未來有望與最先進的GPU競爭,顯著降低AI的環境足跡。
這一發現的意義在於,它證明了一個極其廉價且標準化的器件——MOSFET——能夠實現過去需要數百萬美元研發投入才能達到的神經形態功能。研究團隊在兩家不同的晶圓廠驗證了結果,均獲得100%良率。這為AI硬體的可持續發展開闢了全新路徑。