Google が Ironwood TPU を発表:AI 推論コンピューティングにおける強力な飛躍

BigGo Editorial Team
Google が Ironwood TPU を発表:AI 推論コンピューティングにおける強力な飛躍

Google の最新チップ革新は、同社の人工知能コンピューティングへのアプローチにおける大きな転換を示しており、単なるトレーニングだけでなく、AI 推論の増大する需要に焦点を当てています。この技術大手は、AI モデルが推論能力に向けて進化するにつれて、計算コストが開発から展開へとシフトしていることを認識しています。

推論コンピューティングへのシフト

Google Cloud Next 25 イベントで、Google は第7世代のテンソル処理ユニット(TPU)である Ironwood を発表しました。以前の世代が主に AI トレーニングワークロード向けに位置づけられていたのとは異なり、Ironwood は推論—トレーニング済み AI モデルからユーザーリクエストに応じて予測を行うプロセス—への戦略的転換を表しています。このシフトは、業界が実験的な研究プロジェクトから、企業による AI モデルの実用的かつ広範な実装へと移行している人工知能における経済的な転換点を認識しています。

技術的進歩

Ironwood は、前世代の第6世代 Trillium TPU に比べて印象的な技術的改善を提供します。Google によると、新しいチップはワット当たりの性能が2倍になり、29.3兆の浮動小数点演算を毎秒実行します。メモリ容量は劇的に増加し、チップあたり192GBの高帯域幅メモリ(HBM)を搭載—これは Trillium の6倍です。さらに、メモリ帯域幅は4.5倍に向上して毎秒7.2テラビットに達し、チップ内およびシステム間でのデータ移動能力が大幅に向上しています。

Ironwood TPU 仕様と前世代(Trillium)との比較

機能 Ironwood (第7世代) Trillium (第6世代) 改善率
電力あたりの性能 29.3 TFLOPS ~14.65 TFLOPS 2倍
HBMメモリ容量 チップあたり192GB チップあたり32GB 6倍
メモリ帯域幅 7.2 TBps 1.6 TBps 4.5倍
チップあたりの最大計算能力 4,614 TFLOPs 記載なし -
最大スケーリング ポッドあたり9,216チップ 「数十万」 -
スケール時の総計算能力 42.5エクサフロップス 記載なし -

スケーリング能力

おそらく最も印象的なのは、Ironwood のスケーリング能力です。この TPU は1つのポッドあたり最大9,216チップまでスケールアップでき、驚異的な42.5エクサフロップスの計算能力を提供します。これを理解するために、Google は現在世界最大のスーパーコンピュータである El Capitan の24倍以上の計算能力があると述べています。この大規模なスケーリングの可能性は、Google の DeepMind が設計した Pathways ソフトウェアスタックによってさらに強化され、開発者は何万もの Ironwood TPU を連携させて活用することができます。

経済的影響

Ironwood の発表のタイミングは、AI インフラのコストが急増していることを考えると特に重要です。ウォール街のアナリストたちは、特に Google の Gemini のようなモデルが計算需要を劇的に増加させる推論能力に向かって進化するにつれて、AI システムの構築と展開に関連する莫大な費用にますます注目しています。自社の高性能推論チップを開発することで、Google は Nvidia 、 AMD 、 Intel などのベンダーへの依存度を減らし、インフラコストを数十億ドル節約できる可能性があります。

市場ポジショニング

Google は10年以上にわたって6世代の TPU を開発してきましたが、Ironwood を推論優先チップとして明確に位置づけることは、過去のアプローチからの転換を表しています。以前、Google は TPU を最先端の研究に必要な投資として説明していましたが、確立されたベンダーからのチップの代替とは見なしていませんでした。推論市場はチップ業界では大量市場と考えられており、トレーニング済みのニューラルネットワークから日々の予測を必要とする何千または何百万もの顧客のニーズを満たす必要があります。

ソフトウェアの開発

ハードウェアの発表と並行して、Google は Pathways on Cloud を通じて Pathways ソフトウェアを一般に公開することも発表しました。このソフトウェアは AI コンピューティングワークロードを異なるコンピュータに分散させ、顧客が AI リソースの効率と利用率を向上させることを可能にします。

AI コンピューティングの未来

Ironwood により、Google は単に情報を提示するだけの応答型モデルから、解釈と推論が可能な積極的なシステムへと移行する、次世代 AI コンピューティングの最前線に自らを位置づけています。Google の ML、システム&クラウド AI 担当 VP/GM である Amin Vahdat が述べたように、Ironwood は思考や推論型 AI モデルを大規模に動かすために特別に設計されており、単にプロンプトに応答するだけでなく、複雑な問題を推論できるより洗練された AI アプリケーションに対する Google のビジョンを示しています。