Google は、現在 Android の最新ベータ版でテスト中の Gemini 向けに、新しい精密画像編集機能で AI 機能を強化しています。このアップグレードは、ユーザーに AI 生成画像のより細かな制御を可能にし、 ChatGPT の DALL-E のような競合他社に対抗することを目指しています。
ベータ版の新しい編集ツール
Android 向け Google ベータアプリ(バージョン15.40.31.29)の最新版では、 Gemini 内で AI 生成画像をより直感的に編集する方法が導入されています。ユーザーは正確な編集のための選択を行うことができ、画像の特定の部分に的を絞った修正が可能になりました。この機能は、ユーザーが修正のためにテキストプロンプトのみに頼っている現行バージョンの主要な制限に対処しています。
仕組み
- テキストプロンプトを使用して初期画像を生成
- 編集する画像の特定の部分を選択
- より狭く、焦点を絞った変更のためのフォローアッププロンプトを提供
デモンストレーション動画では、犬の画像を生成し、その後、犬が被っている帽子の種類を変更するなどの具体的な編集を行う能力が紹介されています。
現在の制限
期待が高まる一方で、この機能はまだ開発途中です:
- 編集は必ずしも正確または信頼できるものではない
- 簡単な変更が時として画像の意図しない部分を変更してしまうことがある
- 各編集には処理時間がかかる(場合によっては10秒以上)
競争環境
このアップデートにより、 Google Gemini は他の AI 画像生成ツールとより直接的に競合することになります:
- ChatGPT の DALL-E
- Midjourney (現在、トップクラスの AI 画像生成ツールとされている)
- Apple の近日公開予定の Image Playground
今後の展望
AI 画像生成ツールが急速に進化する中、 Google の精密編集への注力は Gemini に優位性をもたらす可能性があります。しかし、この機能の真の影響は、正式にリリースされ、ユーザーによって徹底的にテストされてはじめて明らかになるでしょう。
現時点では、これらの新機能を試してみたい人々は、 Google が機能をより広くロールアウトするのを待つ必要があります。これは近い将来に行われると予想されています。