Google Geminiが画像編集とPDF分析でAI機能を拡張

BigGo Editorial Team
Google Geminiが画像編集とPDF分析でAI機能を拡張

Googleは、視覚的なコンテンツ作成とドキュメント分析の両方を強化する2つの重要なアップデートにより、Gemini AIの機能を拡充しています。

このインターフェースは、音声コマンドを通じてユーザー対話を強化するGoogleのGemini AIの革新的な機能を例示しています
このインターフェースは、音声コマンドを通じてユーザー対話を強化するGoogleのGemini AIの革新的な機能を例示しています

GeminiにAI画像編集機能が登場

Googleは、GeminiのAI画像生成ツールに微調整機能を導入し、ユーザーが生成後にAI生成画像の詳細な編集を行えるようにする予定です。この機能は、解剖学的な誤りや不可能な建築デザインなど、AI生成画像によくある問題に対処することを目的としています。

今後のアップデートでは、2つの編集方法が提供されます:

  1. テキストベースの調整:既存のAI生成画像の特定の側面を修正するためのプロンプトを送信できます。
  2. インタラクティブな編集:画像の特定の領域を選択し、希望する変更を記述すると、Geminiが選択した領域のみに修正を適用します。

これらのツールは、視覚的な正確さと迅速な納期が重要なグラフィックデザイン、マーケティング、ソーシャルメディアなどの分野の専門家にとって特に価値があるでしょう。

Googleはこのような機能を実装する最初の企業ではありませんが(OpenAIのDALL-EやAdobe Fireflyなどの類似機能が存在します)、このアップデートはGeminiの技術的進歩を示すものであり、Googleが生成AIの分野で競争を続けていることを表しています。

このインターフェースは、Gemini が Google のエコシステム内で高度な画像編集機能を通じて生産性を向上させる方法を示しています
このインターフェースは、Gemini が Google のエコシステム内で高度な画像編集機能を通じて生産性を向上させる方法を示しています

Google DriveのPDFビューアーにGeminiを統合

別の開発として、GoogleはGoogle DriveのPDFビューアーに直接Gemini機能を導入しています。この統合により、PDF分析とコンテンツ作成タスクにGemini 1.5 Proの力が活用されます。

Gemini PDF統合の主な機能には以下が含まれます:

  • 長文で複雑なPDFの要約
  • ドキュメントの内容に基づく質問応答機能
  • PDF情報を使用したコンテンツ作成ツール(例:学習ガイド、メール下書き)
  • 複数のGoogle Driveファイルの情報を組み合わせる機能

この機能は、スキャンされたドキュメント、テキストが多いファイル、複雑な表を含むファイルなど、さまざまなタイプのPDFをサポートしています。

このGemini統合は、Google One AI Premiumの加入者およびGemini Business、Enterprise、Educationアドオンを利用するユーザーに展開されています。

これらのアップデートは、Googleがエコシステム全体でGeminiの機能を拡張し、AI駆動のツールをより身近で日常的な生産性ワークフローに統合することへのコミットメントを示しています。

アップデート:8月1日木曜日 22:48

Googleは、人気のあるサービス向けの新しい拡張機能でGeminiの機能をさらに拡大しています。今後の統合には、メモ取り用のGoogle Keep、タスク管理用のGoogle Tasks、イベントスケジュール用のGoogle Calendarが含まれます。これらの拡張機能により、ユーザーは音声コマンドを通じてこれらのサービスと対話でき、Googleエコシステム内の生産性が向上します。さらに、Spotifyの拡張機能が開発中で、これはGeminiの最初のサードパーティ統合となります。これにより、ユーザーはSpotifyアプリを起動せずに音楽やポッドキャストの再生を制御できるようになります。その他の潜在的な拡張機能として、Google Homeとの統合や電話アプリの機能が検討されており、Googleがさまざまなサービスやプラットフォームにわたってユーザーのデジタルライフの中心的なハブとしてGeminiを位置付けようとしていることを示しています。

GeminiとGoogle Driveの統合により、PDF分析とコンテンツ作成が強化され、ユーザーのワークフローが効率化されます
GeminiとGoogle Driveの統合により、PDF分析とコンテンツ作成が強化され、ユーザーのワークフローが効率化されます