このところの生成AIの爆発的な普及に伴い、各地でAI処理に向けたデータセンターの建設が進められている。経済ニュースで、「**社が新たに1 GWクラスのデータセンターの建設を発表した。AIブームに勝ち残るため各社のデータセンター投資がますます加熱している」などと聞いたことがあるだろう。データセンターにはNVIDIAのBlackwellに代表される最先端のAIチップを乗せたITラックが多数設置され、このニュースのように消費電力を単位とする処理能力の大きさに注目が集まる。データセンターの処理能力が、1秒あたりのトークン処理数のような情報処理の尺度ではなく、ばっさりと総消費電力で示されるのがなんとも即物的だ。AIチップの処理効率向上に日夜尽力している技術者が、私は電気炉を作っているのじゃないとがっかりしていることだろう。とはいえ、電力供給がデータセンターの処理能力を決める鍵になっていることが垣間見える。ちなみに、1 GWとは標準的な原子力発電所1基の出力に相当する。冗談のような話だが、チャッピーと「最近山火事が多いね、地球温暖化の影響かなあ」とお話ししている裏で、地球温暖化を忘れたかのように電力が消費されているのだ。いまさら火力発電所を作れないと考える各国が、脱原発政策を捨てて原発再稼働に舵を切った背景には、AIデータセンターの自国内設置に出遅れたくないとの思惑がある(関税を武器に外国政府から金をせしめて公然と火力発電所新設を進めるおかしな国もあるが)。AIデータセンターが電力を爆食いする背景には、ITラックを多数集めて規模の効果を実現するのと同時に、肝腎のAIチップ自体がパソコンのプロセッサと比べてはるかに大きな電力を消費する生成AIならではの事情もある。大規模AIデータセンターの稼働には、電気食い虫のAIチップに必要な時に必要な電力を過不足なく供給する電力供給アーキテクチャが、裏方で支える重要な技術になる。本稿では、近い将来のAIデータセンターの電力供給アーキテクチャとそれを支える半導体パワーデバイスについて解説する。
さて、パワーエレクトロニクス業界に波紋を投じたのが、NVIDIAが昨年(2025年)5月に公開した技術ブログだった。
“NVIDIA 800 VDC Architecture Will Power the Next Generation of AI Factories” と題して、2027年には消費電力が 1 MW を越えるであろうITラックに 800 V 直流で電力を供給する新しいアーキテクチャを提案し、協業する企業を募ったのだ。
NVIDIA is leading the transition to 800 VDC data center power infrastructure to support 1 MW IT racks and beyond, starting in 2027. To accelerate adoption, NVIDIA is collaborating with key industry partners across the data center electrical ecosystem, including: ・・・・・・
賛同企業は、発表の時点で13社、2025年10月には30社に迫っている。
AIデータセンターの概要 ~ 敷地全景から半導体チップまで一気見 ~
800 V直流給電とはどんなもので、今までと何が違うのかを議論する前に、この提案の背景となった次世代AIデータセンターとはどんなものか見ておこう。下の動画はマイクロソフトがWisconsin州に建設した新しいデータセンターの全景である。
中央の白い建屋がデータ処理をするサーバーラックが並ぶ中核施設である。ここはホールと呼ばれる。その左右に櫛形に広がるのがホールで発生した熱を逃す冷却設備である。ホールよりもはるかに広い敷地面積に注目してほしい。左端には受電設備が並んでいる。エネルギーの流れから見ると、系統から受電した電力が、ホールの中で熱に変わり、冷却設備から大気中に捨てられる巨大な電力消費施設である。
ホールの中に入ると、AIサーバーラックと補助ラックが何百台も並ぶ。それらを繋ぐ信号線や電力ケーブルが天井に張り巡らされている。
NVIDEA Blackwellを例に、サーバーラックの中をAIチップ (Graphics Processing Unit: GPU) まで見ていこう。ラックの中には18枚の計算ノードが収められられている。下の写真は1台の計算ノードを引き出したところ。
計算ノードを分解したのが下の写真。銅製の水冷ジャケットの下にGPU 4チップが載るGPUボードが見える。その他のスペースには電源などが配置されている。ラック内の全ての計算ノードが高速データリンクで結ばれ、合計72台のGPUがあたかもひとつのプロセッサーであるかのように動作する。
NVIDIA GB200 NVL4 GPUボードの写真を示す。上から、4個のNVIDIA Blackwell GPU と、 2個のNVIDIA Grace CPUが並ぶ
NVIDIA Blackwell GPUの写真を示す。中央の一番大きなチップがGPUの本体。周囲に8個並ぶのが High Bandwidth Memory (HBM) と呼ばれる広帯域の積層DRAMである。GPUとHBMは、両者が乗る基板(インターポーザ)にしつらえた広帯域のデータリンクで結ばれている。TSMCがCoWoS (Chip on Wafer on Substrate) と呼ぶ最先端の2.5次元パッケージで組み立てられている。
最終的に電力を消費するNVIDIA Blackwell Ultra GPUのチップイメージを示す。レチクルサイズいっぱいの2枚のダイが背中合わせに 10 TB/s の広帯域インターフェース (NV-HBI) で結合されている。情報処理の心臓部となるStreaming Multiprocessor (SM) と呼ばれる160個の機能ブロックが 8個のGraphics Processing Clusters (GPCs) にまとめられた並列度の高い構成になっている。TSMCの4Nプロセスで製造され、2080億個のトランジスタが集積される。これらの微細なトランジスタは直流 0.8 V で動作する。
(↓2をクリックして次のページへ)













コメントを残す