Google Gemini が大幅アップデート、自動PDF要約機能と安定版2.5モデルが利用可能に

BigGo 編集部
Google Gemini が大幅アップデート、自動PDF要約機能と安定版2.5モデルが利用可能に

Google は AI アシスタント Gemini に大幅な機能強化を実施し、最新の2.5モデルファミリーの一般提供開始と併せて、インテリジェントな PDF 処理機能を導入した。これらのアップデートは AI を活用した生産性ツールの大幅な進歩を表しており、ユーザーにより積極的な支援と様々なアプリケーションでの性能向上を提供している。

プロアクティブなPDFインテリジェンスが文書ワークフローを変革

Gemini は現在、ユーザーが Google Drive に保存された PDF ファイルを開く際に自動的に要約カードを生成し、手動での要約リクエストの必要性を排除している。この AI アシスタントは基本的な要約を超えて、「提案書の草案を作成」や「この履歴書に基づいて面接質問をリスト化」といった文脈に応じた次のアクションを提案する。ユーザーがこれらの提案されたアクションを選択すると、Gemini は便利なサイドパネルを開いてリクエストを即座に実行する。

この機能強化により文書処理ワークフローが大幅に効率化される。包括的な120ページの助成金文書でのテストでは、この機能の能力が実証され、複雑な情報を8つの主要な箇条書きを含む500語のアクセスしやすい要約に圧縮し、関連するフォローアップのプロンプトを提供した。この機能は20言語をサポートし、Google Drive のインターフェースとシームレスに統合されている。

技術仕様

  • PDF 要約サポート:20言語
  • コンテキストウィンドウ( Flash-Lite ):100万トークン
  • テストケース性能:120ページの文書 → 8つの箇条書きを含む500語の要約
  • 全ての2.5モデルにおけるマルチモーダル入力サポート
  • Google Search およびコード実行機能との統合

Drive でのPDF表示体験を向上

Google は Drive 内での PDF の表示方法を改良し、新しいブラウザタブで文書を開く方式からオーバーレイプレビューシステムに移行した。この変更により、ユーザーが主要なワークスペース内に留まりながら、サイドパネルを通じた Gemini のアクセシビリティが維持される。以前のタブベースのアプローチを好むユーザーは、Drive の設定でこの設定を調整できる。

PDF 要約機能は特定のサブスクリプション層を対象としており、Business Standard Plus、Enterprise Standard Plus、Google AI Pro、Ultra サブスクライバー、および Gemini Education アドオンを持つユーザーや既存の Gemini Business および Enterprise サブスクリプションを持つユーザーが含まれる。

PDF 要約機能の利用可能性

  • Business Standard Plus 契約者
  • Enterprise Standard Plus 契約者
  • Google AI Pro 契約者
  • Ultra 契約者
  • Gemini Education アドオンユーザー
  • Gemini Education Premium アドオンユーザー
  • Gemini Business アドオンユーザー
  • Gemini Enterprise アドオンユーザー

Gemini 2.5モデルが一般提供を達成

数ヶ月間のパブリックプレビューテストを経て、Google は Gemini 2.5 Pro と Gemini 2.5 Flash の安定版を正式にリリースした。これらのモデルは現在、Gemini モバイルアプリ、Google AI Studio、Vertex AI プラットフォームを通じてアクセス可能であり、実験段階から本格運用可能な状態への移行を示している。

新しいFlash-Liteモデルが効率性を優先

安定版リリースと併せて、Google は Gemini 2.5 Flash-Lite をプレビューで導入し、2.5ファミリーで最もコスト効率が高く最速のモデルとして位置づけている。Pro や標準 Flash バリアントの性能レベルには及ばないものの、Flash-Lite はコーディング、数学、科学、推論、マルチモーダルベンチマークにおいて2.0の前世代と比較して優れた結果を提供している。

Flash-Lite モデルは翻訳や分類タスクなどの大容量でレイテンシに敏感なアプリケーションで優れた性能を発揮する。印象的な100万トークンのコンテキストウィンドウとマルチモーダル入力機能を維持しながら、開発者にとって運用コストの削減を提供している。このモデルはまた、思考バジェットをサポートし、ユーザーが過度なトークン消費なしに高度な推論を有効にできる。

Gemini 2.5 モデル比較

モデル ステータス 主要機能 対象用途
Gemini 2.5 Pro 一般提供中 最高性能 複雑な推論タスク
Gemini 2.5 Flash 一般提供中 性能と速度のバランス 一般的な生産性向上
Gemini 2.5 Flash-Lite プレビュー版 最もコスト効率が良く、最高速 大容量・低遅延重視タスク

プラットフォーム全体での幅広いアクセシビリティ

これらのアップデートは、高度な AI 機能をより身近で実用的にするという Google のコミットメントを反映している。安定版 Gemini 2.5 モデルは、iOS および Android モバイルアプリケーションを含む、ユーザーが通常 Gemini にアクセスする場所で利用可能であり、開発者は Google AI Studio と Vertex AI プラットフォームを通じて Flash-Lite を試すことができる。