Google が Gemini の文書アップロード機能を無料ユーザーに開放し、ライブキャプション機能も追加

BigGo Editorial Team
Google が Gemini の文書アップロード機能を無料ユーザーに開放し、ライブキャプション機能も追加

Google の AI チャットボット Gemini が大幅な機能アップグレードを受け、無料・有料ユーザー双方にとってアクセシビリティとユーザー体験が大きく向上しています。これらのアップデートは、高度な AI 機能の民主化とプラットフォームの使いやすさの向上に対する Google のコミットメントを示しています。

Google の Gemini チャットボットは、機能を大幅に向上させ、ユーザー体験の向上に対する取り組みを反映しています
Google の Gemini チャットボットは、機能を大幅に向上させ、ユーザー体験の向上に対する取り組みを反映しています

無料ユーザーにも開放されたファイルアップロード機能

Google は、これまで Gemini Advanced の利用者限定だったファイルのアップロードと分析機能を、無料ユーザーにも展開し始めました。この拡張により、ユーザーは Android アプリと gemini.google.com のウェブインターフェースの両方で文書のアップロードと分析が可能になりました。この機能はテキストファイル、プログラミングコード、 Microsoft Office 文書、PDF、 Google Workspace ファイルなど、幅広いファイル形式をサポートしており、文書分析や情報抽出のための多目的ツールとなっています。

包括的なファイル形式のサポート

新しいファイルアップロード機能は、様々な文書タイプを処理する上で印象的な汎用性を示しています。ユーザーはプレーンテキストファイル、複数のプログラミング言語( C 、 C++ 、 Python 、 Java 、 PHP 、 SQL 、 HTML )、一般的な文書形式( Word 、 PDF 、 RTF 、 Google Docs )、スプレッドシートファイル( Excel と Google Sheets )を扱うことができます。無料ユーザーのコンテキストウィンドウサイズは公式に発表されていませんが、 Advanced バージョンの100万トークン制限よりも小さくなると予想されています。

対応ファイル形式:

  • テキストファイル(.txt)
  • プログラミング言語: C 、 C++ 、 Python 、 Java 、 PHP 、 SQL 、 HTML
  • ドキュメント: Microsoft Word 、 PDF 、 RTF 、 Google Docs
  • スプレッドシート: Excel 形式、 Google Sheets

上位バージョンのコンテキスト制限:

  • 最大トークン数:1,000,000
  • テキストで約1,500ページ分に相当
  • またはコード約30,000行分

開発中の新しいライブキャプション機能

別の重要な開発として、 Google は Gemini の会話モードにリアルタイムキャプションを実装する作業を進めています。このアクセシビリティに焦点を当てた機能により、インターフェースにキャプションボタンが追加され、ユーザーは Gemini の応答をライブ転写で確認できるようになります。この機能には、ユーザーのニーズに応じてサイズやスタイルを調整できるカスタマイズ可能なキャプション設定が含まれます。この追加機能は、特に騒がしい環境にいるユーザーや聴覚障害のあるユーザーに恩恵をもたらします。

展開状況と互換性

ファイルアップロード機能は無料の Gemini アカウントに段階的に展開されていますが、利用可能性はユーザーによって異なる場合があります。これらの新機能は Gemini 2.0 Flash モデルと互換性があり、旧バージョンの 1.5 Flash モデルからの移行を示しています。ライブキャプション機能は現在も開発中ですが、テストでは有望な結果を示しており、今後のリリースでの公開が予定されています。