Google の研究者が AI 画像生成で Doom を現実に

BigGo Editorial Team
Google の研究者が AI 画像生成で Doom を現実に

クラシックゲームと最先端の人工知能を融合させた画期的な取り組みで、Google の研究者たちが AI 画像生成技術を使用して、伝説的な一人称シューティングゲーム Doom のプレイ可能なバージョンの作成に成功しました。GameNGen と呼ばれるこの革新的なプロジェクトは、AI がゲーム開発やインタラクティブメディアに革命をもたらす可能性を示しています。

仕組み

GameNGen プロジェクトは、2段階のプロセスを使用しています:

  1. 強化学習を通じて AI エージェントが Doom をプレイするよう訓練され、成功したゲームプレイに報酬を与え、ミスにはペナルティを課しました。
  2. その後、これらの AI エージェントが生成したゲームプレイデータを使用して、 Stable Diffusion 1.4 のカスタマイズバージョンが訓練されました。

結果として、単一のテンソル処理ユニットを使用して、約20フレーム/秒でリアルタイムのインタラクティブな Doom ゲームプレイを生成できる AI モデルが誕生しました。

このフローチャートは、AIエージェントがどのようにトレーニングされ、生成モデルで使用されるかを示す GameNGen 手法の概要を示しています
このフローチャートは、AIエージェントがどのようにトレーニングされ、生成モデルで使用されるかを示す GameNGen 手法の概要を示しています

印象的なリアリズム

AI が生成した Doom のバージョンは驚くほど説得力があり、研究者たちは人間の評価者がゲームの短いクリップとシミュレーションのクリップを区別する能力がランダムな推測よりもわずかに優れている程度だと主張しています。このモデルは以下のようなゲームの核心的なメカニズムの理解を示しています:

  • 敵の行動
  • アイテムの収集
  • 弾薬の管理
  • ヘルスシステム
  • キーカードドア

制限と特異な点

印象的ではありますが、AI が生成した Doom にはいくつかの顕著な制限があります:

  • モデルは直近3秒間のゲームプレイしか記憶できません
  • AI 生成画像に典型的な視覚的なグリッチやぼかし効果が存在します
  • 敵が突然現れたり、破壊されたオブジェクトが再出現したりするような論理的な矛盾が発生します

将来への影響

GameNGen の背後にいる研究者たちは、この技術が新しいゲーム開発手法への道を開く可能性があり、開発者がテキストや視覚的なプロンプトを使用してゲームを生成・編集できるようになる可能性を示唆しています。AI が完全に洗練されたゲームをゼロから作成するにはまだ遠い道のりですが、このプロジェクトはインタラクティブメディアへの生成 AI の応用において重要な一歩前進を表しています。

AI が進化し続けるにつれて、ゲーム開発においてますます洗練された応用が見られるようになり、人間が作成したコンテンツと AI が生成したコンテンツの境界線が曖昧になっていく可能性があります。 AI 画像生成器で Doom を実行することの成功は、このゲームの伝説的な適応性に敬意を表するだけでなく、ゲームと AI 統合の未来に向けてエキサイティングな可能性を切り開いています。