Intel が公式に Gaudi 3 AI アクセラレータの発売を発表しました。急速に拡大する人工知能市場において、 NVIDIA の主力製品である H100 GPU に対する低コストの代替品として位置付けられています。
Gaudi 3 は前世代から大幅な進化を遂げ、64個のテンソルプロセッサコア(TPC)と8個の行列乗算エンジン(MME)を搭載しています。各アクセラレータには128GBの高帯域幅メモリ(HBM2E)が搭載され、FP8演算で最大1,856 TFLOPSの性能を発揮します。 Intel はアーキテクチャを最適化し、現代のAIワークロードに不可欠なFP8とBFloat16演算に焦点を当てています。
Gaudi 3 の生の性能指標は一部の領域で NVIDIA の H100 に及ばないものの、 Intel は価格戦略によって市場シェアの獲得を狙っています。同社は、特定のAIモデルにおいて Gaudi 3 が H100 と比較してドル当たりの性能が最大80%向上していると主張しています。 Intel は、8台の Gaudi 3 アクセラレータキットの価格を約125,000ドルに設定すると発表しており、1台あたり約15,625ドルとなります。これは現在30,000ドル以上する NVIDIA H100 1台の価格と比べて大きな違いがあります。
Gaudi 3 の主な特徴は以下の通りです:
- 64個のテンソル処理コア(TPC)
- 8個の行列乗算エンジン(MME)
- 128GB HBM2E メモリ(帯域幅3.67 TB/s)
- 96MBのオンダイSRAMキャッシュ
- 24個の200GbEネットワークインターフェース
- 600WのTDP
Intel は AI 推論タスクにおける大幅な性能向上を謳っています。 LLaMA 3 8B モデルでは、 Gaudi 3 は H100 と比較して推論速度が9%向上し、ドル当たりの性能が80%向上したとされています。 LLaMA 70B のような大規模モデルでは、 Intel は推論スループットが19%向上し、ドル当たりの性能が2倍になったと主張しています。
Gaudi 3 は OAM 準拠カードや PCIe アドインカードなど、さまざまな形態で提供される予定です。 Intel は Dell 、 HPE 、 Supermicro などの主要サーバーメーカーと提携し、 AI に特化したシステムに Gaudi 3 を組み込んでいます。クラウドでの利用も計画されており、 IBM Cloud や Intel 自身の Tiber Developer Cloud で Gaudi 3 リソースが提供される予定です。
AI ハードウェア競争が激化する中、 Intel の Gaudi 3 戦略は、大規模な AI 展開を検討している組織により手頃な選択肢を提供することに焦点を当てているようです。しかし、 NVIDIA の次世代アーキテクチャ Blackwell が控える中、 Intel の価格優位性が AI アクセラレータ市場の大きなシェアを獲得するのに十分かどうかは今後の展開を見守る必要があります。
Gaudi 3 ベースのシステムの一般販売は2023年第4四半期に予定されており、 Dell や Supermicro などの一部パートナーは10月から出荷を開始する予定です。この発売は、 NVIDIA が支配する AI ハードウェア分野で Intel が本格的な競争相手として自らを確立しようとする重要な瞬間となります。
Intel の多様な AI ソリューションは、さまざまな産業に対応するよう設計されており、各分野における技術革新を促進します |