Google の Gemini AI アシスタントは、発見され展開される重要な新機能により急速に進化し続けています。最近の調査では、今後実装される動画分析機能とチャット履歴検索機能が明らかになり、また最新の Gemini 2.5 Pro モデルはユーザーに十分な印象を与え、有料購読する価値のある AI ツールの仲間入りを果たしました。
Gemini に動画分析機能が登場
Android 版 Gemini(バージョン 16.15.38.sa.arm64 ベータ)の APK 解析により、Google が AI アシスタントに動画分析機能を追加する準備を進めていることが明らかになりました。開発者たちはこのまだリリースされていない機能を有効化し、ユーザーが動画をアップロードして内容について Gemini に質問できるようにしました。この実装では最大 5 分間の動画コンテンツを処理でき、AI は視覚的要素を正確に分析し、建築的特徴に基づいて場所を特定し、映像に関する文脈情報を提供することができるようです。
この機能は、録画された会議の要約、画面録画による技術的問題のトラブルシューティング、または様々な目的のための視覚的コンテンツの分析に役立つ可能性があります。この機能は最終テスト段階にあるようで、近日中、おそらく Google の今後の I/O イベントで正式発表される可能性があります。
今後の Gemini の機能
- 5分間のアップロード制限付きビデオ分析
- チャット履歴検索機能
- 文書分析機能の向上
チャット履歴の検索機能
同じベータバージョンで発見されたもう一つの注目すべき改善点は、Gemini の使いやすさにおける大きなギャップに対応するものです。現在、AI は過去の会話の包括的な履歴を保持していますが、それらを効率的に検索する方法がありません。この欠点は、以前のやり取りから特定の情報を見つけようとするヘビーユーザーにとって特に不便でした。
APK の解析により、SEARCH_CHAT_HISTORY に関連する文字列が発見され、Google がこの問題の解決策を開発していることが示されています。この機能はまだ初期開発段階にあり、機能的な実装はまだ見えていませんが、検索技術における Google の中核的な能力に沿った重要な使い勝手の向上を表しています。
Gemini 2.5 Pro がユーザーを魅了
これらの今後の機能に加えて、Google が最近リリースした Gemini 2.5 Pro は AI 愛好家の間で話題を呼んでいます。このモデルは以前のバージョンから大幅に進化し、複雑な推論、コーディング、大きな文書の分析などの機能を備えています。最大 100 万トークン(200 万まで拡張予定)の巨大なコンテキストウィンドウにより、以前のバージョンよりもはるかに多くの情報を一度に処理し理解することができます。
Gemini 2.5 Pro と並んで、Google はカスタマーサービスのような大量のアプリケーションに対して速度とコスト効率に最適化された Gemini 2.5 Flash も導入しました。両モデルはテキスト、画像、音声、動画にわたるマルチモーダル入力をサポートし、モデルが問題をどれだけ徹底的に考えるかを調整できる Manual Reasoning Control などの機能を備えています。
この改善は、通常は有料サブスクリプションを制限している選択的な AI ユーザーでさえ、Gemini を彼らのツールキットに加えるほど十分なものでした。これらの高度なモデルを最大限に活用するための鍵は、ユーザーがそれらにどのようにアプローチするか—明確なコミュニケーション、具体的なプロンプト、そしてそれらの能力と限界について現実的な期待を持つことにあるようです。
Gemini 2.5 Pro の機能
- 最大100万トークンのコンテキストウィンドウ(200万トークンは近日公開予定)
- マルチモーダル入力対応(テキスト、画像、音声、動画)
- モデルの思考プロセスを調整するための Manual Reasoning Control
- Canvas:ドキュメントやコード編集のためのインタラクティブスペース
- 複数のモダリティでリアルタイムストリーミングを実現する Live API
進化する AI の風景
Gemini 2.5 Pro は Google の AI 製品にとって大きな前進を表していますが、ユーザーは異なる機能間を切り替える際に Google のエコシステム内での統合がやや分断されていると感じていると指摘しています。このモデルはまた、ニュアンスのある文章、より深い思考、そして時折の幻覚—大規模言語モデル全般に共通する課題—に直面し続けています。
AI ツールが成熟し続けるにつれて、それらの間の区別は生の能力についてではなく、特定のワークフローに対してユーザーがそれらをどれだけ効果的に活用できるかについてになってきています。これらの今後の機能と最近の改善により、Google は Gemini を、特にマルチモーダル分析機能と Google のエコシステムとの深い統合を重視するユーザーにとって、ますます競争が激しくなる AI アシスタント市場における真剣な競争相手として位置づけています。