AI業界における重要な進展として、 DeepSeek が正式に R1 モデルをリリースし、オープンソースAI開発における大きな成果を上げました。このリリースは、高性能な機能とオープンソースアプローチを組み合わせた戦略的な動きであり、AIモデルのアクセシビリティと開発の展望を変える可能性を秘めています。
革新的なトレーニングアプローチ
DeepSeek R1 は、従来の教師あり微調整(SFT)アプローチから離れ、主に強化学習(RL)に依存する画期的なトレーニング手法を導入しています。R1-Zero バリアントは、従来のSFTデータを使用せずに純粋なRLトレーニングの効果を実証し、顕著な性能向上を達成しました。この革新的なアプローチにより、 AIME 2024 におけるモデルの性能が15.6%から71.0%まで、RLトレーニングのみで向上しました。
性能ベンチマーク
このモデルは、特に数学、コーディング、推論タスクにおいて、様々なベンチマークで優れた能力を示しています。 DeepSeek R1 は AIME 2024 で79.8%、 MATH-500 で97.3%というインプレッシブなスコアを達成し、 OpenAI の o1 の性能に匹敵あるいはわずかに上回る結果を示しました。コーディングコンペティションでは、 Codeforces で2029 Eloレーティングを達成し、人間の参加者の96.3%を上回る成績を収めました。
ベンチマーク性能:
- AIME 2024:79.8%( OpenAI o1 を上回る)
- MATH-500:97.3%( OpenAI o1 と同等)
- Codeforces:Eloレーティング2029(人間の参加者の96.3%を上回る)
Jim Fan が AIの競争状況について論じ、 DeepSeek-R1 のパフォーマンス向上を強調しています |
競争力のある価格戦略
DeepSeek は R1 のAPIサービスを非常に競争力のある価格で提供しています。モデルのAPI料金は、入力のキャッシュヒットが100万トークンあたり0.14ドル、キャッシュミスが0.55ドル、出力が100万トークンあたり2.19ドルに設定されています。この価格体系は OpenAI の提供価格と比較して大きなコスト優位性を持ち、開発者や企業がより高度なAI機能にアクセスしやすくなっています。
API価格比較:
-
DeepSeek R1:
- 入力(キャッシュヒット):100万トークンあたり0.14米ドル
- 入力(キャッシュミス):100万トークンあたり0.55米ドル
- 出力:100万トークンあたり2.19米ドル
-
OpenAI o1:
- 入力:100万トークンあたり15米ドル
- 出力:100万トークンあたり60米ドル
オープンソースへのコミットメント
このリリースには、モデルだけでなく、包括的な技術文書と6つの蒸留された小規模モデルも含まれています。 MIT ライセンスに従い、ユーザーはモデルの重みと出力を含め、自由に使用、修正、商用利用することができます。この方針は多くの商用AIモデルとは大きく異なり、AI コミュニティにおける透明性と協調的なイノベーションを促進します。
蒸留とエコシステムの発展
DeepSeek は Qwen や Llama のような一般的なアーキテクチャを使用して、 R1 の機能を小規模な実用的モデルに効果的に蒸留することに成功しました。32Bおよび70Bの蒸留バージョンは OpenAI の o1-mini に匹敵する性能レベルを達成し、高性能を維持しながら大規模モデルから小規模モデルへの知識転移の効果を実証しています。
将来への影響
このリリースは、高度なAI機能の民主化に向けた重要な一歩を表しています。最先端の性能とオープンソースのアクセシビリティ、競争力のある価格を組み合わせることで、 DeepSeek R1 はAI分野のイノベーションを加速させながら、より広範な開発者や組織が強力なAIツールにアクセスできるようにする可能性を秘めています。