AI研究能力の大きな進歩として、 OpenAI はオンラインリサーチと分析の方法を革新するために設計された高度なツール「 Deep Research 」を発表しました。この新機能は、複数のソースからの複雑な情報を理解し、統合し、提示するAIの能力における大きな前進を示しています。
高度な研究機能
Deep Research は、ウェブブラウジングと Python 分析に最適化された OpenAI の o3 モデルの特殊バージョンを活用しています。このシステムは、数百のオンラインソースを同時に処理し、テキスト、画像、PDFを分析して包括的な研究レポートを生成できます。特筆すべき点は、文脈を維持し、詳細な引用を提供することで、調査結果の透明性と検証可能性を確保できることです。
実用的な応用
このツールは、徹底的で信頼性の高い研究を必要とする金融、科学、政策、エンジニアリング分野の専門家を主なターゲットとしています。また、自動車、家電製品、家具などの大型購入に関する情報に基づいた意思決定など、実用的な消費者ニーズにも対応しています。ユーザーは、PDFやスプレッドシートなどのアップロードされた文書と共にクエリを入力でき、通常5〜30分以内に結果が得られます。
主な機能:
- 処理時間:クエリあたり5-30分
- 月間クエリ制限:100回( Pro ユーザー)
- 対応ファイル形式: PDF 、スプレッドシート
- 現在の出力形式:テキストベースのレポート
- プラットフォーム対応:ウェブのみ(モバイル/デスクトップは近日公開予定)
パフォーマンスとベンチマーク
Deep Research は、厳密なテスト環境で印象的な能力を示しています。Humanity's Last Exam 評価では、100以上の分野における専門家レベルの質問で26.6%の正確性を達成しました。また、推論とマルチモーダルな流暢さを必要とする実世界の問題に対するAIのパフォーマンスを評価する GAIA ベンチマークでトップの位置を獲得しています。
パフォーマンス指標:
- Humanity's Last Exam の正確性:26.6%
- GAIA ベンチマークで最先端(SOTA)の性能を達成
- 対象範囲:100以上の学術分野
専門家レベルのタスクにおける Deep Research の性能を示し、厳密なテスト環境での精度を強調したグラフ |
現在の制限と今後のアップデート
強力な機能を持つ一方で、 Deep Research には現在いくつかの制約があります。ユーザーは時折、事実の不正確さや、信頼できる情報源と誤情報を区別する際の課題に遭遇する可能性があります。 OpenAI はこれらの制限を認識しており、今後のアップデートで対処する計画です。同社は、画像の埋め込み、データの可視化、専門的なデータソースとの統合を導入する計画を発表しています。
利用可能性とアクセス
現在、 Deep Research は ChatGPT Pro ユーザーが月間100クエリの制限付きで利用できます。 OpenAI は今後数週間以内に Plus 、 Team 、および Enterprise ユーザーへのアクセスを拡大する予定です。この機能は現在ウェブのみで利用可能ですが、今月後半にはモバイルとデスクトップアプリへの統合が予定されており、これは高度な研究機能をさまざまなプラットフォームのユーザーにより身近なものにする重要な一歩となります。