AI News HubLIVE
サイト内リライト2 分で読了

AI消費電力を迅速に推定する新手法

MITおよびMIT-IBM Watson AI Labの研究者らは、特定のプロセッサ上でAIワークロードを実行した際の消費電力を数秒で推定する高速予測ツール「EnergAIzer」を開発した。誤差は約8%で、データセンターのエネルギー効率向上に貢献する。

ソースAIhub著者: MIT News

人工知能(AI)の急速な普及に伴い、データセンターの電力消費は深刻な課題となっています。ローレンス・バークレー国立研究所の予測によれば、2028年までに米国のデータセンターが消費する電力は全米総電力の最大12%に達する見込みです。この問題に対処するため、マサチューセッツ工科大学(MIT)とMIT-IBM Watson AI Labの研究チームは、特定のプロセッサやAIアクセラレータ上でAIワークロードを実行する際の消費電力を数秒で推定できる高速予測ツール「EnergAIzer」を開発しました。

従来のエネルギー消費予測手法は、ワークロードを個々のステップに分解し、GPU内部の各モジュールの利用状況を逐次エミュレートするため、AIトレーニングやデータ前処理のような大規模なワークロードでは数時間から数日を要していました。しかし、AIワークロードには多くの反復パターンが存在します。ソフトウェア開発者はGPU上でプログラムを効率的に動作させるために、並列処理コアへのタスク分散やデータ移動の最適化など、構造化された最適化手法をよく用います。これらの最適化により生じる規則的な構造を活用することで、高速な電力推定が可能となりました。

研究チームは、こうした最適化からGPUの電力使用パターンを捉える軽量モデル「EnergAIzer」を開発しました。ただし、高速推定だけでは全てのエネルギーコストを考慮できません。例えば、GPUがプログラムを実行するたびに設定や構成に固定のエネルギーが必要であり、データのチャンクごとに追加のエネルギーが消費されます。また、ハードウェアの変動やデータアクセスの競合により、GPUが利用可能な帯域幅を全て使い切れず、処理が遅延し結果的にエネルギー消費が増加する場合があります。これらの追加コストやばらつきを考慮するため、研究者らは実際のGPUから収集した測定データに基づく補正項を生成し、推定モデルに適用しました。

テストでは、EnergAIzerは実際のGPU上のAIワークロード情報を用いて、誤差約8%という高い精度で消費電力を推定できました。これは従来の手法(数時間を要する)と同等の精度でありながら、推定時間はわずか数秒です。ユーザーはワークロード情報(実行するAIモデル、入力の数と長さなど)を入力するだけで、数秒でエネルギー消費推定値を得られます。さらに、GPUの構成や動作速度を変更することで、設計上の選択が全体の消費電力に与える影響を即座に確認できます。

EnergAIzerの利点は、既存のハードウェアだけでなく、将来のGPUや新しいデバイス構成にも適用可能な点です。ただし、ハードウェアが短期間に大幅に変化しないことが前提です。研究チームは今後、最新のGPU構成でEnergAIzerをテストし、複数のGPUが連携してワークロードを実行する大規模環境にも対応できるようスケールアップを目指しています。主任研究者のKyungmi Lee氏は「持続可能性に真の影響を与えるには、ハードウェア設計者、データセンター事業者、アルゴリズム開発者など、スタック全体にわたって迅速なエネルギー推定を提供するツールが必要です。このツールはその目標に向けた一歩です」と述べています。本研究成果は、IEEE International Symposium on Performance Analysis of Systems and Softwareで発表されました。