Google は Gemini 2.5 Pro プレビューモデルの大幅なアップグレードを展開し、今後数週間以内に予定されている待望の安定版リリースに向けた新たな一歩を踏み出した。この最新の機能強化は、開発者からのフィードバックと性能最適化に基づいて最も強力な AI モデルを改良し続ける Google の取り組みを表しており、エンタープライズ規模のアプリケーション向けの主要ソリューションとしての地位を確立している。
パフォーマンスベンチマークで大幅な改善を実証
アップグレードされた Gemini 2.5 Pro プレビューは、複数の業界ベンチマークで顕著な性能向上を実証した。このモデルは LMArena で24ポイントの Elo スコア上昇を達成し、この競争的なランキングシステムにおける Google のリードをさらに拡大した。より印象的なのは、WebDevArena リーダーボードで35ポイントの Elo 上昇により1443のスコアに到達し、トップポジションを獲得したことである。これらの改善は、複雑な開発タスクや Web ベースの課題を処理するモデルの能力向上を裏付けている。
ベンチマーク性能の向上:
- LMArena : 24ポイントの Elo スコア上昇により、トップポジションを維持
- WebDevArena : 35ポイントの Elo 上昇により1443スコアに到達し、1位を獲得
- GPQA および Humanity's Last Exam : トップティアの性能を維持
開発者重視の機能強化で実世界のニーズに対応
Google はこのアップグレードで開発者からのフィードバックに特に対応し、モデルのスタイルと構造の改善に焦点を当てた。強化されたバージョンは、より良いフォーマットでより創造的な応答を提供するようになり、プロフェッショナルな用途により実用的になった。さらに、プレビューモデルは Google I/O 2025 でプレビューされた機能である思考バジェットをサポートするようになり、開発者がトークン制限を通じて AI モデルがリクエストを処理する範囲をカスタマイズできるようになった。この機能は、品質の高い出力を維持しながら高額なクエリを回避することで、コストに関する懸念に直接対応している。
追加された主要機能:
- カスタマイズ可能なトークン制限を持つシンキングバジェット
- より良いフォーマットされた応答のためのスタイルと構造の改善
- AI 応答における創造性の向上
- エンタープライズ規模のアプリケーション対応
エンタープライズ対応の機能とコスト効率
Google はこのアップグレードされたプレビューをエンタープライズ規模のアプリケーション対応として位置づけ、長いコンテキスト処理を使用して大規模なデータセット、コードベース、文書を分析するのに適していることを強調している。同社はまた、市場の他の思考モデルと比較したモデルのコスト効率性を強調し、高度な AI 機能を必要とする企業にとって魅力的な選択肢としている。GPQA や Humanity's Last Exam などの学術ベンチマークでのモデルのトップレベルの性能は、厳格なプロフェッショナルアプリケーションへの対応準備ができていることをさらに証明している。
利用可能性とアクセスオプション
アップグレードされた Gemini 2.5 Pro プレビューは現在、Google AI Studio と Vertex AI プラットフォーム経由でアクセス可能な Gemini API を通じて利用できる。ユーザーは Gemini アプリを通じてもすぐにモデルにアクセスできる。プレビューは Google の他のモデルと比較して高い価格設定の有料ユーザーに限定されているが、同社は既に Pro ユーザーのクエリ制限を緩和しており、今月後半の安定版リリース時により手頃な価格になる可能性がある。
利用可能性のタイムライン:
- 現在: Gemini API ( Google AI Studio 、 Vertex AI )および Gemini アプリ経由でプレビュー版が利用可能
- 予定:2025年6月から数週間以内に安定版リリース開始予定
- アクセス:現在は緩和されたクエリ制限付きの有料ユーザーに限定
安定版リリースに向けた展望
Google が Gemini 2.5 Pro が数週間後に一般提供開始されることを確認している中、このアップグレードは安定版ローンチ前の最終改良段階を表している。このタイミングは、Gemini 2.5 Pro と 2.5 Flash モデルの両方が完全な一般リリースに向けて準備を進める中での Google の広範な AI 戦略と一致している。2.5 Flash がより高速でアクセスしやすい機能を持つ一般消費者をターゲットとする一方、Pro バージョンは最大限の能力と精度を必要とするプロフェッショナルおよびエンタープライズアプリケーションに焦点を当て続けている。