Nvidia が Blackwell を発表:次世代 AI パワーハウスが革新的な FP4 精度を実現

BigGo Editorial Team
Nvidia が Blackwell を発表:次世代 AI パワーハウスが革新的な FP4 精度を実現

Nvidia は、次期 Blackwell プラットフォームで AI の世界に革命をもたらそうとしています。GPU 技術と AI コンピューティングにおける画期的な進歩を示しています。Hot Chips 2024 でのプレゼンテーションに向けて、同社はデータセンターの AI 処理の未来を垣間見せてくれました。

最先端のサーバーラックに展示された NVIDIA Blackwell テクノロジー
最先端のサーバーラックに展示された NVIDIA Blackwell テクノロジー

Blackwell:単なる GPU 以上のもの

Blackwell は、AI に焦点を当てたハードウェアの包括的なエコシステムを表しています:

  • Blackwell GPU:中心となる製品で、TSMC の 4NP プロセスで 2,080 億個のトランジスタを搭載
  • Grace CPU: Nvidia のカスタム ARM ベースプロセッサ
  • NVLink Switch Chip:超高速 GPU インターコネクトを実現
  • BlueField-3:先進的なデータ処理ユニット
  • ConnectX-7 と ConnectX-8:次世代ネットワークインターフェースカード
  • Spectrum-4 と Quantum-3:最先端のネットワークスイッチ

前例のない性能と効率性

Blackwell GPU は印象的な仕様を誇ります:

  • 20 ペタ FLOPS の FP4 AI 性能
  • HBM3e メモリによる 8 TB/秒のメモリ帯域幅
  • 1.8 TB/秒の双方向 NVLink 帯域幅

Nvidia の革新的なアプローチは、2つのレチクルリミットされた GPU を1つのパッケージに組み合わせることで、最適な通信密度、レイテンシ、およびエネルギー効率を実現しています。

Nvidia の最新プラットフォームの詳細な比較。 Blackwell プラットフォームの優れたパフォーマンスの仕様を含む
Nvidia の最新プラットフォームの詳細な比較。 Blackwell プラットフォームの優れたパフォーマンスの仕様を含む

NVLink:マルチ GPU 性能の秘密の sauce

アップグレードされた NVLink Switch は、ファブリック帯域幅を 1.8 TB/秒に倍増させ、GB200 NVL72 ラックで最大 72 個の GPU 間のシームレスな通信を可能にします。この進歩は、 Meta の 4,050 億パラメータの Llama-3.1 のような、ますます複雑化する AI モデルに取り組む上で重要です。

FP4 精度の先駆け

世界初となる、 Nvidia は FP4 コンピューティングを使用した AI 画像生成をデモンストレーションし、 Quasar 量子化システムの可能性を示しました。この画期的な技術により、 FP16 モデルに匹敵する画質を維持しながら、大幅な帯域幅の節約が可能になります。

Nvidia の FP4 精度によるAI画像生成の進歩を示すAI生成画像の比較
Nvidia の FP4 精度によるAI画像生成の進歩を示すAI生成画像の比較

液冷技術の革新

Nvidia は、温水直接チップ冷却ソリューションを探求しており、データセンター施設の電力コストを最大 28% 削減することを約束しています。このアプローチは、冷却効率を向上させるだけでなく、サーバーの寿命を延ばし、熱の再利用の可能性を開きます。

AI が AI を構築する

おそらく最も興味深いのは、 Nvidia が AI を活用してチップ設計プロセスを最適化していることです。生成 AI を使用して Verilog コードを作成し、将来の GPU アーキテクチャの開発を加速する可能性があります。

Nvidia が今年後半に Blackwell を顧客に出荷する準備を進める中、テクノロジー業界は、これらのイノベーションが AI の世界に与える影響を熱心に待ち望んでいます。 Blackwell Ultra 、 Rubin 、 Rubin Ultra といった後続製品も控えており、 Nvidia は今後数年間、 AI コンピューティングにおけるリーダーシップを維持する態勢を整えているようです。