実験室のミスがコンピューティングを変革するかもしれない
研究者が偶然、1つのCMOSトランジスタがニューロンとシナプスの動作を模倣できることを発見。これによりAIのエネルギー消費を大幅に削減できる可能性がある。
今日、あなたは大規模言語モデルに質問したり、LinkedInの接続提案を受け入れたり、YouTubeのおすすめ動画を視聴したり、Google Mapsの交通予測に基づいて通勤ルートを変更したかもしれません。つまり、人工知能を利用したのです。しかし、その相互作用がどれだけのエネルギーを消費しているか、そしてその理由をあなたは知らないかもしれません。
AIは膨大なデータを処理する必要があり、通常は数千のGPUを搭載した大規模データセンターで行われます。各GPUは最大1000ワットを消費します——掃除機や食器洗い機と同程度ですが、データセンターのプロセッサは24時間365日途切れることなく動作します。この非効率性の根本的な原因は、GPUがソフトウェアと数十億のトランジスタを使って人工ニューラルネットワークをシミュレーションし、データ移動に大量のエネルギーを必要とすることです。対照的に、人間の脳は同様のAIタスクで約100万倍のエネルギー効率を誇ります。
この効率に近づくため、ニューロモーフィックエンジニアリングは生物のニューロンやシナプスのように動作する電子部品や回路を構築しようとしています。しかし、既存の手法は信頼性に欠ける実験的なデバイスに依存するか、単一のニューロンをシミュレートするために多数のCMOSトランジスタを必要とし、システム規模が制限されていました。そんな中、研究者は偶然、標準的なCMOSトランジスタ——しかも最先端ではないもの——が単体でニューロンとシナプスの両方として機能することを発見しました。
2024年、学生がトランジスタとメモリスタからなるメモリ回路を測定中に、トランジスタのバルク端子を接続し忘れたところ、電流の急激な増加とヒステリシスループを観測——これはニューロン的な挙動です。その後の分析で、バルク端子が浮遊状態にあると、衝突イオン化で生成された正孔が基板に蓄積し、隠れたバイポーラトランジスタをトリガーして電流スパイクを生み出すことが判明しました。バルク端子抵抗を調整することで、この動作を精密に制御でき、完全な電子ニューロンが実現できます。
さらに驚くべきことに、同じデバイスがシナプスとしても機能します。バルク端子電圧を調整することで、電荷がゲート絶縁膜にトラップされ、トランジスタのコンダクタンスが変化します。このコンダクタンス状態は安定しており、自由に調整可能です。研究者はこのニューロン-シナプス組み合わせをNSRAM(ニューロシナプティック・ランダム・アクセス・メモリ)と名付けました。
従来の実装では数十から数百のトランジスタが必要だったのに対し、NSRAMはわずか1~2個のトランジスタで済み、既存のシリコン製造プロセスと完全互換です。テストでは100%のデバイスが1000万回のサイクルを故障なく通過しました。研究チームは特許を出願し、Nature誌に結果を発表しました。
従来のニューロモーフィックチップは、音声処理やコンピュータビジョンなどのタスクで1000分の1の消費電力削減を達成していますが、面積と速度の面で制約を受けています。NSRAMはこれらの制約をさらに打破する可能性があります。次のステップは、コンピュータモデルの改良、周辺回路の設計、システムレベルシミュレーションです。NSRAM技術はまずエッジAIタスクに適し、バッテリー駆動デバイスのインテリジェンスを向上させます。うまくスケールできれば、将来的に最先端GPUと競合し、AIの環境負荷を大幅に削減できるでしょう。
この発見の意義は、極めて安価で標準化されたデバイスであるMOSFETが、過去に数百万ドルの研究費を投じても困難だったニューロモーフィック機能を実現できることを証明した点にあります。研究チームは異なる2つのファウンドリで結果を検証し、いずれも100%の歩留まりを得ました。これはAIハードウェアの持続可能な発展に全く新しい道を開くものです。