中国のAIスタートアップ DeepSeek が、新しいマルチモーダルAIモデル Janus-Pro を発表しました。これは、効率的で費用対効果の高いアプローチが業界大手と競争できることを示す重要な開発となります。この発表は、AI開発のコストとリソース要件に関する議論が活発化している時期に行われました。
新しいマルチモーダルAIへのアプローチ
DeepSeek の Janus-Pro は、画像の分析と生成の両方が可能な新しい自己回帰フレームワークを採用しています。モデルファミリーは10億から70億のパラメータ範囲で展開され、フラッグシップモデルの Janus-Pro-7B は、 GenEval や DPG-Bench などのベンチマークテストにおいて、 OpenAI の DALL-E 3 や Stability AI の Stable Diffusion XL を上回る性能を示したと報告されています。
モデル仕様:
- パラメータ範囲:1B から 7B
- トレーニング要件(1.5B モデル):128台の A100 GPU、7日間
- トレーニング要件(7B モデル):256台の A100 GPU、14日間
- 画像解像度制限:384 x 384(小規模モデル)
費用対効果の高いイノベーション
Janus-Pro の開発は、 DeepSeek の「小規模だが強力」な戦略を示しています。トレーニングプロセスは remarkably 効率的で、1.5Bパラメータモデルは128台の NVIDIA A100 GPU を7日間必要とし、7Bパラメータバージョンは256台の A100 GPU を14日間必要とします。このアプローチは、業界の一般的な「より大きいほど良い」という考え方や、膨大な計算要件とは大きく異なります。
オープンソースとアクセシビリティ
MITライセンスの下でリリースされた Janus-Pro は、 Hugging Face などのAI開発プラットフォームを通じて商用利用が可能です。このオープンソースアプローチにより、個人や小規模企業が高度なAI技術にアクセスできるようになりましたが、一部のモデルは384 x 384解像度での画像分析に制限されています。
市場への影響と価格設定
DeepSeek のAPIサービス価格は競争力のある水準に設定されており、キャッシュヒットの入力トークンは100万トークンあたり1人民元、キャッシュミスは4人民元、出力トークンは100万トークンあたり16人民元となっています。この価格モデルと効率性は、競争力のあるAI開発に必要なリソースに関する従来の常識に挑戦しています。
価格体系:
- 入力トークン(キャッシュヒット):CNY¥1/百万
- 入力トークン(キャッシュミス):CNY¥4/百万
- 出力トークン:CNY¥16/百万
セキュリティとアクセスに関する考慮事項
最近のセキュリティ上の課題を受けて、 DeepSeek は一時的に+86の電話番号のみに登録を制限するなどの防御措置を実施しました。この動きは、コアユーザーへのサービス提供を維持しながら、AI展開におけるセキュリティの重要性の高まりを示しています。