OpenAI、視覚処理機能を備えた高度な推論モデル O3 と O4-mini を発表

BigGo Editorial Team
OpenAI、視覚処理機能を備えた高度な推論モデル O3 と O4-mini を発表

人工知能は、テクノロジー企業が可能性の限界を押し広げる中、急速に進化し続けています。AI推論能力における重要な進歩として、 OpenAI はユーザーのクエリに応答する前により徹底的に考えるように設計された2つの新しいモデルを発表しました。

新しい推論モデルのリリース

OpenAI は正式に2つの新しいAI推論モデルを発表しました:同社が最も強力な推論モデルと説明する o3 と、サイズとコストに対して印象的なパフォーマンスを提供する、より小さく高速な代替モデル o4-mini です。これらのモデルは、 OpenAI が最近導入したフラッグシップモデル GPT-4.1 に続くもので、同社の推論重視型AIシステムの次の進化を表しています。標準モデルとは異なり、これらの推論モデルは「話す前に考える」ように特別に訓練されており、より高品質な応答を提供するために追加の処理時間を要します。

新しい OpenAI モデル概要

モデル 説明 主な特徴
o3 最も強力な推論モデル 視覚的推論、ツール統合、強化されたパフォーマンス
o4-mini より小型、高速、コスト効率の良いモデル 視覚的推論、ツール統合、速度に最適化
o4-mini-high より高性能なバリアント 効率性を維持しながら強化された機能

ツール統合

  • ウェブブラウジング
  • Python コーディング
  • 画像理解
  • 画像生成

視覚理解の統合

これらの新しいモデルにおそらく最も重要な進歩は、画像を使って考える能力です。o3 と o4-mini の両方が、単に見たものを説明するのではなく、視覚情報を推論プロセスに直接統合できるようになりました。この機能により、モデルはスケッチ、ホワイトボード、さらには低品質やぼやけた画像でも処理できます。モデルは分析の一環として画像を操作することができ、特定の要素にズームインしたり、コンテンツをより理解するために画像を回転させたりすることができます。この視覚的推論は、AIが異なる形式の情報を処理し活用する能力における大きな前進を表しています。

エージェント型ツールの使用

もう一つの大きなブレークスルーは、モデルが推論プロセス中に独立してすべての ChatGPT ツールを使用できる能力です。これにはウェブブラウジング、Pythonコーディング、画像理解、画像生成機能が含まれます。 OpenAI はこれを、ユーザーに代わって独立してタスクを実行できるより「エージェント的な」 ChatGPT に向けた一歩と説明しています。実用的には、これはモデルが複雑な多段階の問題を解決するために、人が必要に応じて電卓を手に取るのと同様に、どのツールを使用するかを自律的に決定できることを意味します。デモンストレーション中、研究者たちは o3 が科学研究ポスターを分析し、追加情報のためにインターネットを閲覧し、画像の異なる要素にズームインして包括的な回答を生成する様子を示しました。

パフォーマンスの向上

OpenAI によると、o3 と o4-mini の両方が、新しいツールアクセス機能を使用しなくても、様々なベンチマークで前モデルを上回るパフォーマンスを示しています。これらのモデルは指示に従う能力が向上し、より有用で検証可能な応答を提供します。o3 が最大限の機能を持つプレミアムオファリングである一方、o4-mini は低コストと高速性で強力なパフォーマンスを提供するように最適化されており、高度な推論をより身近なものにしています。

利用可能性とアクセス

新しいモデルは ChatGPT Plus、Pro、Teamサブスクライバーに即時利用可能で、モデルピッカーに o3、o4-mini、o4-mini-high として表示されます。これらは以前の推論モデル o1、o3-mini、o3-mini-high に取って代わります。Proユーザーは今後数週間で o3-pro へのアクセスを得ますが、それまでは o1-pro へのアクセスを継続します。開発者も OpenAI の API を通じてこれらのモデルにアクセスできます。

追加の発表

これらの新しいモデルと並行して、 OpenAI は Codex CLI をリリースしました。これはユーザーのターミナルでローカルに実行されるオープンソースのコーディングエージェントです。このツールは、o3 や o4-mini を含むAIモデルをユーザー自身のコードやタスクに接続する簡単な方法を提供します。GPT-4.1 のサポートも近日中に予定されています。同社はまた、これらのテクノロジーを使用した初期プロジェクトを支援するための100万ドル(約1億5000万円)のイニシアチブを発表し、API クレジットを通じて25,000ドル(約375万円)単位の助成金を提供しています。

安全性への配慮

OpenAI は、両方の新モデルがリリース前に広範な安全性テストを受けたことを強調しています。これらは同社の安全性プログラムの下でストレステストが行われ、更新された準備フレームワークに従って評価されました。詳細な結果は完全なシステムカードで確認できます。