ゲームにおいてリアルな群れの行動を作り出すことは長い間開発者にとって課題でしたが、AI言語モデルは現在、ゲーム開発において印象的な能力を示しています。最近の実験では、様々なAIモデルに「 Shepherd's Dog 」という羊の群れを操るゲームを一度の試みで作成するよう挑戦させました。その結果、 Claude 3.7 が明確な勝者となりました。
Shepherd's Dog の背後にあるコンセプトはシンプルながらも魅力的です:プレイヤーは犬を操作して、夜が来る前に羊を囲いに誘導します。このゲームを面白くしているのは、羊のリアルな群れの行動であり、本物のような集団力学を示しながら、犬の存在に反応し、障害物を避けて移動する必要があります。
AIモデルは様々な成功度を示す
Claude 3.7 は28点満点中24点で競争を制し、多くのユーザーが本物の楽しさを持ち、自然な羊の動きを実現したゲームだと評したものを作成しました。 Claude のバージョンでは、特に指示されていないにもかかわらず、夜への移行もアニメーション化されていました。あるプレイヤーは、このゲームはシンプルさと魅力において初期の iPhone 時代のモバイルゲームを思い起こさせると述べています。
他のモデルは様々な結果を示しました。 Anthropic の o3-mini は28点中16点を獲得し、群れの行動のために古典的な boids アルゴリズムを実装しました。技術的には印象的でしたが、一部のユーザーは boids アルゴリズムが常に動き続けるのに対し、実際の羊は静止することもあるため、羊にとって完全に自然な感じではないと指摘しました。
リーダーボードの最下位では、 Deepseek は有効な JavaScript を生成できず、 GPT-4o と Gemini Pro はそれぞれ28点中わずか4点で、機能が限られ問題も抱えていました。
AIモデルのShepherd's Dogゲームリーダーボード
モデル | スコア | 備考 |
---|---|---|
Claude 3.7 | 24/28 | 非常に印象的なデモ、一部の障害物ダイナミクスが欠けている |
o3-mini | 16/28 | 機能が不足しているが、群れの動きとゲームプレイは良好 |
o1 Pro | 12/28 | o3-miniと類似 |
Mistral | 12/28 | 羊の誘導が適切に実装されていない |
GPT-4o | 4/28 | 機能が限定的、モデルが続行しなかった |
Gemini Pro | 4/28 | 羊が囲いに留まらないため難しい |
Deepseek | 0/28 | JavaScriptが無効 |
Cursor | 0/28 | 印象的だが「ワンショット」として認定されない可能性あり |
群れアルゴリズム:課題の核心
このゲームを作る上での中心的な課題は、リアルな群れの行動を実装することです。多くのAIモデルは、1980年代に開発された群れの行動をシミュレートするための有名なアプローチである boids アルゴリズムを使用しました。しかし、あるコメンターが指摘したように、 boids は羊のシミュレーションには理想的ではないかもしれません:
「 o3-mini は群れのために「boids」アルゴリズムを実装しているようです(おそらくオンラインでの普及度が高いため)が、これはあまり適していないと思います。実際、boidsでは各要素が一定(または最小)の速度を持ち、羊が「走る」のを決して止めません。 Claude の群れの行動の方が、羊にとってより自然に見えます。」
この洞察は、 Claude 3.7 の実装が、羊に最小速度ゼロを許可することで、より現実的な哺乳類の行動を作り出すことに成功したことを強調しています。これはシミュレーションをより本物らしく感じさせる微妙だが重要な違いです。
コミュニティの参加と改善
これらのAI生成ゲームに対するコミュニティの反応は熱狂的で、複数のユーザーが自分のバージョンを共有したり、改善案を提案したりしています。あるユーザーは複数のAIモデルを組み合わせて拡張版を作成し、人間の指導がAI生成コードの改良にどう役立つかを示しました。
一部のユーザーは、デスクトップでマップが大きすぎたり、羊が角に詰まったりするなど、人間による改良が必要なプレイアビリティの問題を指摘しました。これらの観察は、AIが一発で機能的なゲームを作成できる一方で、体験を洗練させるには人間によるプレイテストと反復が不可欠であることを強調しています。
興味深いことに、複数のコメンターが以前に自分で同様のゲームを作成しようとしたことがあると述べており、羊の群れのコンセプトがゲーム開発者の間で広く人気があることを示しています。群れの行動をうまく実現することの難しさは、多くの人が直面してきた共通の障壁のようです。
この実験は、AIのコーディング能力の急速な進歩を示すと同時に、現在の限界も明らかにしています。フィードバックや反復なしの一発勝負の創作として、これらのゲームは印象的な技術的成果を表していますが、その可能性を最大限に引き出すには依然として人間による改良が役立ちます。
これらのAI作成ゲームを試してみたい人は、 GitHub HTML プレビューを通じて利用できますが、一部のユーザーは特定のブラウザからセキュリティ警告が表示されたと報告しています。これは、基本的には GitHub Pages でホストされる単純な HTML/JavaScript ゲームにとっては予期せぬ障壁です。