Nvidia は、次期 Blackwell プラットフォームで AI の世界に革命をもたらそうとしています。GPU 技術と AI コンピューティングにおける画期的な進歩を示しています。Hot Chips 2024 でのプレゼンテーションに向けて、同社はデータセンターの AI 処理の未来を垣間見せてくれました。
最先端のサーバーラックに展示された NVIDIA Blackwell テクノロジー |
Blackwell:単なる GPU 以上のもの
Blackwell は、AI に焦点を当てたハードウェアの包括的なエコシステムを表しています:
- Blackwell GPU:中心となる製品で、TSMC の 4NP プロセスで 2,080 億個のトランジスタを搭載
- Grace CPU: Nvidia のカスタム ARM ベースプロセッサ
- NVLink Switch Chip:超高速 GPU インターコネクトを実現
- BlueField-3:先進的なデータ処理ユニット
- ConnectX-7 と ConnectX-8:次世代ネットワークインターフェースカード
- Spectrum-4 と Quantum-3:最先端のネットワークスイッチ
前例のない性能と効率性
Blackwell GPU は印象的な仕様を誇ります:
- 20 ペタ FLOPS の FP4 AI 性能
- HBM3e メモリによる 8 TB/秒のメモリ帯域幅
- 1.8 TB/秒の双方向 NVLink 帯域幅
Nvidia の革新的なアプローチは、2つのレチクルリミットされた GPU を1つのパッケージに組み合わせることで、最適な通信密度、レイテンシ、およびエネルギー効率を実現しています。
Nvidia の最新プラットフォームの詳細な比較。 Blackwell プラットフォームの優れたパフォーマンスの仕様を含む |
NVLink:マルチ GPU 性能の秘密の sauce
アップグレードされた NVLink Switch は、ファブリック帯域幅を 1.8 TB/秒に倍増させ、GB200 NVL72 ラックで最大 72 個の GPU 間のシームレスな通信を可能にします。この進歩は、 Meta の 4,050 億パラメータの Llama-3.1 のような、ますます複雑化する AI モデルに取り組む上で重要です。
FP4 精度の先駆け
世界初となる、 Nvidia は FP4 コンピューティングを使用した AI 画像生成をデモンストレーションし、 Quasar 量子化システムの可能性を示しました。この画期的な技術により、 FP16 モデルに匹敵する画質を維持しながら、大幅な帯域幅の節約が可能になります。
Nvidia の FP4 精度によるAI画像生成の進歩を示すAI生成画像の比較 |
液冷技術の革新
Nvidia は、温水直接チップ冷却ソリューションを探求しており、データセンター施設の電力コストを最大 28% 削減することを約束しています。このアプローチは、冷却効率を向上させるだけでなく、サーバーの寿命を延ばし、熱の再利用の可能性を開きます。
AI が AI を構築する
おそらく最も興味深いのは、 Nvidia が AI を活用してチップ設計プロセスを最適化していることです。生成 AI を使用して Verilog コードを作成し、将来の GPU アーキテクチャの開発を加速する可能性があります。
Nvidia が今年後半に Blackwell を顧客に出荷する準備を進める中、テクノロジー業界は、これらのイノベーションが AI の世界に与える影響を熱心に待ち望んでいます。 Blackwell Ultra 、 Rubin 、 Rubin Ultra といった後続製品も控えており、 Nvidia は今後数年間、 AI コンピューティングにおけるリーダーシップを維持する態勢を整えているようです。