MiniMax が M1 推論モデルを発表、100万トークンコンテキストと超低コスト訓練で DeepSeek に挑戦

BigGo 編集部
MiniMax が M1 推論モデルを発表、100万トークンコンテキストと超低コスト訓練で DeepSeek に挑戦

中国のAIスタートアップ MiniMax が、業界リーダーである DeepSeek への大胆な挑戦として、競争の激しい推論モデル分野に参入した。同社の最新発表は、中国のビッグシックスAI企業がグローバルリーダーと競争できる高度な推論能力の開発を競う中で、重要なマイルストーンとなっている。

革命的なコンテキスト長と効率性の突破

MiniMax の M1 モデルは、100万トークンのコンテキスト入力をサポートする画期的な機能を導入し、Google の Gemini 2.5 Pro と同等の性能を実現し、DeepSeek R1 の容量から8倍の改善を示している。このモデルは推論出力において最大8万トークンもサポートし、長文コンテキスト処理の新たな業界標準を確立している。この成果は、MiniMax 独自の Lightning Attention メカニズムによるもので、これは注意行列を計算する新しいアプローチであり、訓練と推論の両フェーズにおいて計算オーバーヘッドを大幅に削減する。

MiniMax M1 主要仕様

  • コンテキスト入力:1,000,000トークン( DeepSeek R1 の8倍)
  • 推論出力:80,000トークン
  • 訓練コスト:534,700米ドル(512台の H800 GPU、3週間)
  • アーキテクチャ: Lightning Attention メカニズムを搭載した Mixed MoE
  • アルゴリズム: CISPO 強化学習( DAPO より2倍高速な収束)

技術革新による費用対効果の高い訓練

同社は、わずか512台の H800 GPU を3週間使用し、レンタル費用はわずか53万4700米ドルで強化学習フェーズ全体を完了し、モデル開発において驚くべき費用効率を達成した。これは当初の予測から10分の1の削減を表し、MiniMax の技術革新の有効性を実証している。この突破は、従来のトークン更新ではなく重要度サンプリング重みを最適化する新しく開発された CISPO 強化学習アルゴリズムによって実現され、ByteDance の最近の DAPO アルゴリズムを含む競合アプローチの2倍の収束速度を達成している。

業界ベンチマークでの競争力のある性能

17の主要評価データセットでの包括的テストにより、M1 の市場での強力な競争ポジションが明らかになった。このモデルは複数のベンチマークテストで DeepSeek R1 や Qwen3 と同等の性能を示し、OpenAI の O3 モデルの能力に近づいている。特に注目すべきは、TAU-bench 評価によるエージェントツール使用シナリオでの M1 の優れた性能で、一般的な長文コンテキスト理解タスクではわずかに劣るものの、Google の Gemini 2.5 Pro を上回った。

パフォーマンスベンチマーク

  • 17の主要評価データセットでテスト済み
  • DeepSeek R1 および Qwen3 と同等のパフォーマンス
  • OpenAI O3 の能力に近づく
  • TAU-bench(エージェントツール使用)において Gemini 2.5 Pro を上回る
  • 長文コンテキスト理解において Gemini 2.5 Pro にわずかに劣る

市場浸透のための戦略的価格設定

MiniMax は、競争優位性を維持しながらアクセシビリティを最大化するよう設計された段階的価格構造を実装している。0-32kトークンのコンテキスト長では、同社は入力100万トークンあたり0.8中国人民元、出力100万トークンあたり8中国人民元を請求している。32k-128kの範囲では、入力100万トークンあたり1.2中国人民元、出力あたり16中国人民元となり、最大の128k-1Mの範囲では入力あたり2.4中国人民元、出力あたり24中国人民元の価格設定となっている。この価格戦略により、M1 は最初の2つの階層で DeepSeek R1 よりも費用対効果が高く、DeepSeek が対応できない最高階層でユニークな機能を提供している。

価格比較(100万トークンあたり)

コンテキスト長 入力価格(人民元) 出力価格(人民元)
0-32k 0.8 8
32k-128k 1.2 16
128k-1M 2.4 24

注記:最初の2つの階層は DeepSeek R1 よりも優れた価格性能比を提供;最高階層は DeepSeek では利用不可

より広範な製品エコシステムとIPO野望

M1 の発表は、MiniMax の包括的な5日間の製品発表シリーズの一部に過ぎず、Hailuo 02 動画生成モデルと MiniMax Agent プラットフォームも含まれている。この積極的な製品展開は、競合他社の Zhipu AI が先に株式公開申請を行った後、同社が香港IPOの可能性に向けて準備を進めていると報じられている中で行われている。業界観察者は、MiniMax がIPO収益要件を満たすことに大きな課題を抱えており、現在の収入は主に成功している Talkie キャラクターロールプレイアプリケーションと新しい Hailuo AI 動画プラットフォームに依存していると指摘している。

市場ポジションと将来の展望

MiniMax の戦略的ポジショニングは、DeepSeek の市場破壊に続いて関連性を維持しようとする中国のAIスタートアップ間の激しい競争を反映している。同社のマルチモーダル機能、特に Hailuo AI が動画生成製品ランキングでグローバルリーダーシップを達成した動画生成分野への注力は、純粋にテキストに焦点を当てた競合他社と比較して差別化されたアプローチを提供している。しかし、M1 と関連製品の成功が最終的に、MiniMax が中国のトップティアAI企業としてのポジションを維持しながら、成功した株式公開に必要な収益基盤を構築できるかどうかを決定することになる。