Google が最新のテキストから画像生成モデル Imagen 3 をリリースし、AI 画像生成の分野に波紋を広げています。この新バージョンは、 DALL-E 3 や Midjourney v6 などの主要な競合製品を複数の重要な分野で上回っていると、同社は主張しています。
Imagen 3 の性能に関する主張
Google DeepMind の最近の報告によると、 Imagen 3 は以下の点で優れているとされています:
- 全体的なユーザー好感度
- プロンプトと画像の一致度
- 詳細なプロンプト処理能力
- 数値推論能力
Midjourney v6 は依然として視覚的魅力で優位に立っていますが、 Imagen 3 は高品質な出力とユーザーの意図の尊重のバランスが最も優れていると報告されています。
アクセシビリティと制限
Google は現在、米国内のすべてのユーザーに対して、 AI Test Kitchen ウェブサイトを通じて Imagen 3 へのアクセスを拡大しました。この動きは、 Google がツールの能力と安全性に自信を深めていることを示しています。
しかし、初期のユーザーフィードバックによると、 Imagen 3 は前バージョンよりも制限が厳しくなっている可能性があります:
- 問題のある可能性のあるプロンプトに対する感度が上昇
- 以前は達成可能だった結果を得ることが難しいとの報告
- 一見無害な言葉でもコンテンツフィルターが作動する可能性
バランスの取れた対応
Imagen 3 に対する Google の慎重なアプローチは、他の AI 画像生成ツールを巡る最近の論争とは対照的です。同社は、一部の創造的可能性を制限する可能性があっても、責任ある AI 開発を優先しているようです。
Imagen 3 を試す方法
米国在住のユーザーは以下の手順で Imagen 3 を体験できます:
- Google AI Test Kitchen ウェブサイトにアクセス
- Google アカウントでサインイン
- 画像生成ツールにアクセス
Imagen 3 がより広範なユーザーに届くにつれ、 Google が AI 生成画像における創造の自由と倫理的配慮のバランスをどのように洗練させていくか、注目に値します。