中国のAIスタートアップ DeepSeek が、最新の言語モデル DeepSeek-R1 で世界のテクノロジー業界に大きな波紋を投げかけています。このモデルは、 OpenAI の高度なモデルと同等の性能を実現しながら、大幅に低いコストとオープンソースアプローチを採用していることで注目を集めています。
革新的な性能とコスト効率
DeepSeek-R1 は、特に化学、数学、コーディングの分野で OpenAI の o1 モデルに匹敵する優れた能力を実証しています。Chatbot Arena のリーダーボードで第3位を獲得し、 Google Gemini や Microsoft Copilot などの確立された競合を上回りました。競争テストでは、30回のチャレンジラウンドで80%を超える勝率を達成しました。
モデルパフォーマンス指標:
- Chatbot Arena にて第3位にランク付け
- 30ラウンドのテストにおいて勝率80%以上
- 得意分野:化学、数学、コーディング
コスト削減における breakthrough
DeepSeek の成果の中で最も注目すべき点の一つが、そのコスト効率です。R1 の前身である DeepSeek-V3 の訓練コストは約558万ドル(約8億2000万円)で、 GPT-4 などのモデルの訓練に必要とされる7800万ドル(約115億円)の10分の1以下です。この劇的なコスト削減は、革新的なアーキテクチャと最適化されたアルゴリズムによって実現され、AIモデル開発コストに関する従来の常識に挑戦しています。
コスト比較:
- DeepSeek-V3 の学習コスト:558万米ドル
- GPT-4 の推定学習コスト:7,800万米ドル
- コスト削減率:従来モデルと比較して約93%
技術革新とアクセシビリティ
このモデルは、Multi-head Latent Attention(MLA)、Mixture of Experts(MoE)アーキテクチャ、FP8低精度トレーニングなど、最先端の技術を組み込んでいます。DeepSeek はモデルの重みをオープンソース化し、トレーニングの詳細を完全に公開することで、これらのイノベーションをグローバルAIコミュニティにアクセス可能にし、透明性と協調的な開発を促進しています。
API 価格設定:
- 入力トークン(キャッシュヒット):100万トークンあたり0.5人民元
- 入力トークン(キャッシュミス):100万トークンあたり2人民元
- 出力トークン:100万トークンあたり8人民元
業界ダイナミクスへの影響
DeepSeek-R1 の登場は、シリコンバレーに大きな波紋を呼んでいます。Meta を含む主要テクノロジー企業がモデルの機能を分析していると報じられており、 AMD は DeepSeek-V3 を Instinct MI300X GPU 製品に統合することを発表しました。この展開は、従来米国企業が支配してきたAI業界の力学に変化をもたらす可能性を示唆しています。
AIアプリ業界の競争状況を示し、既存のアプリケーションの中で DeepSeek-R1 のような新規参入者の台頭を表現している画像 |
価格戦略と市場アクセス
DeepSeek は、そのAPIサービスに競争力のある価格構造を導入しています。入力トークンは、キャッシュヒットの場合100万トークンあたり0.5人民元、キャッシュミスの場合2人民元、出力トークンは100万トークンあたり8人民元の価格設定となっています。この価格戦略により、開発者や研究者が世界中から高度なAI機能にアクセスしやすくなり、AIの民主化が促進される可能性があります。