Google Research が、ゲーム生成の境界を押し広げる印象的な新しい AI プロジェクトを発表しました。GameNGen と呼ばれるこの AI 駆動のゲームエンジンは、ニューラルネットワークと機械学習を使用して、クラシックな一人称シューターゲーム Doom のプレイ可能な複製をリアルタイムで作成できます。
GameNGen の仕組み
GameNGen は Stable Diffusion AI モデルを利用して、プレイヤーの入力と前のフレームを処理し、新しいゲームプレイ要素をその場で生成します。このシステムは以下のような Doom の核心的なメカニズムをシミュレートできます:
- プレイヤーの動き(回転、横移動)
- 武器の発射と弾薬の追跡
- 敵の行動とダメージ
- レベル生成と探索
注目すべきは、GameNGen が毎秒20フレームで動作し、短いクリップでは実際の Doom のゲームプレイと区別するのが難しいほどの出力を生成することです。
トレーニングプロセス
この偉業を達成するために、Google の研究者たちは様々な難易度とプレイスタイルで Doom をプレイする AI エージェントをトレーニングしました。エージェントはパワーアップを収集しレベルをクリアすることで報酬を得る一方、ダメージを受けるとペナルティを受けるようにしました。このプロセスにより、GameNGen が学習し再現するための何百時間もの視覚的トレーニングデータが生成されました。
AI 生成における革新
GameNGen の重要なブレークスルーは、長時間にわたって視覚的な一貫性を維持する能力です。研究者たちは、Stable Diffusion アニメーションでよく見られるちらつきや品質劣化などの問題を以下の方法で解決しました:
- より長いシーケンスのコンテキストで新しいフレームをトレーニング
- コンテキストフレームにガウシアンノイズを適用して破損させる
- 画像を継続的に修正し安定させる別のニューラルネットワークを実装
現在の制限
印象的ではありますが、GameNGen の Doom シミュレーションには欠点がないわけではありません:
- 視覚的なグリッチやランダムなぼかしが時々発生する
- 敵の死体が死後に不明瞭になる
- HUD のキャラクターの顔のアニメーションが不安定
- 生成されたレベルに一貫性がなく、予期せず変化することがある
ゲーム開発への影響
不完全な点はあるものの、GameNGen は AI 駆動のゲーム制作において大きな一歩前進を表しています。Caltech の AI を活用した Minecraft マップ生成など、他の最近の進歩と組み合わせると、この技術は将来のビデオゲーム開発の方法を革新する可能性があります。
AI が進化し続けるにつれ、オンデマンドで完全にプレイ可能な体験を生成できるゲームエンジンがより多く登場し、開発者とプレイヤーの両方に新たな可能性を開くかもしれません。