ニュース

DeepSeek のAIオープンソース化へのアプローチ:イノベーションと実用的な課題のバランス
急速に進化するAI開発の世界において、 DeepSeek は最近、推論エンジンのコンポーネントをオープンソース化するアプローチを発表し、テクノロジーコミュニティ内で大きな議論を巻き起こしています。同社は、コードベース全体を公開するという実用的な課題に直面する代わりに、オープンソースエコシステムへのより戦略的な貢献を選択しました。パフォーマンスギャップが大きな最適化の可能性を示すコミュニティは、一般に利用可能な推論エンジンと DeepSeek の内部システムの間に大きなパフォーマンスギャップがあることを特定しました。ベンチマークに精通しているユーザーのコメントによると、 vLLM (オープンソースの推論エンジン)は、sharegptデータセットで約5,000トークン/秒、高い同時実行性を持つランダムな2000/100構成で12,000トークン/秒を達成しています。対照的に、 DeepSeek の内部システムは、単一の H800 ノードでプリフィリング中に約73,700トークン/秒、デコーディング中に14,800トークン/秒を提供していると報告されています。この劇的な違いは、オープンソース推論の分野にどれだけ改善の余地があるかを浮き彫りにしています。パフォーマンス比較: vLLM 対 DeepSeek 内部エンジンシステム構成パフォーマンスvLLMsharegpt データセット、高並行性約5,000トークン/秒vLLMランダム2000/100、高並行性約12,000トークン/秒DeepSeek 内部H800ノード、プリフィリング約73,700トークン/秒(入力)DeepSeek 内部H800ノード、デコーディング約14,800トークン/秒(出力)DeepSeek のオープンソース課題コードベースの分岐:1年前の vLLM フォークを基にした大規模なカスタマイズインフラ依存性:内部システムと密接に結合している限られたメンテナンスリソース:モデル開発に集中している小規模な研究チームDeepSeek の貢献戦略スタンドアロン機能を独立したライブラリとして抽出最適化技術と実装の詳細を共有既存のオープンソースプロジェクトとの協力フォークされたコードベースの維持に関する課題コミュニティの多くの開発者は、コードベースの分岐に関する DeepSeek の説明に共感を示しました。同社の推論エンジンは1年以上前の vLLM の初期フォークに基づいており、それ以来、特定のモデル向けに大幅にカスタマイズされてきました。この状況は、元のコードベースから大きく離れたフォークの維持に関して同様の課題を経験した多くのソフトウェアエンジニアに共感を呼んでいます。広範なカスタマイズによって蓄積された技術的負債は、コミュニティの改善を取り入れたり、より広範なユースケース向けにコードを維持したりすることをますます困難にしています。「私もそういう経験があります。おそらく私たちの何人かは...維持可能なサブライブラリを分割し、統合されていなくても直接情報を共有するというアプローチは、コミュニティと協力する本当に良い方法だと思います。」オープンソースAIの背後にある商業的論理議論の中で興味深いスレッドの一つは、商業的なAI企業がなぜ研究や技術を共有するのかという点です。コミュニティの何人かのメンバーは、この一見矛盾するように見える行動の背後にある商業的論理について洞察を提供しました。その動機は多面的であるようです:自分の仕事が公開されることを望むトップ人材の誘致、業界でのマインドシェアの確立、技術を標準として位置づけること、そして最終的にすべての参加者に利益をもたらす分野全体の進歩の加速などです。一部のコメンターは、AIのような急速に発展する分野では、イノベーションを秘密にしておくよりも、エコシステム全体で起こっている進歩に近いことの方が価値があるかもしれないと指摘しました。この視点は、オープンソースへの貢献を利他的な行為としてではなく、相互利益とエコシステムの成長を通じて経済的利益を追求する戦略的なビジネス決断として位置づけています。知識共有とコード共有の実用的価値完全な実行可能コードが利用できない場合でも、知識を共有する価値に関する興味深い視点が浮上しました。いくつかの開発者は、非実行可能コードや技術的な説明が、論文だけでは完全に伝えられない実装の詳細を理解するために非常に価値があると指摘しました。これは、完全な推論エンジンの形ではなくても、最適化や設計の改善を共有する DeepSeek のアプローチが、コミュニティに大きな利益をもたらす可能性があることを示唆しています。結論として、 DeepSeek の決断は、イノベーションの共有の価値と複雑なコードベースを維持する実用的な課題の両方を認識するオープンソース貢献への実用的なアプローチを表しています。AIの開発が加速し続ける中、企業とより広範なコミュニティの両方に利益をもたらす持続可能な知識共有モデルを見つけることが引き続き重要になります。これらの課題に関する DeepSeek の透明性に対するポジティブな反応は、テクノロジーコミュニティが貢献そのものと同様に、オープンソースの維持の現実に関する誠実なコミュニケーションを評価していることを示唆しています。参考:DeepSeek 推論エンジンのオープンソース化への道
AI
39 分前
適切なLinuxディストリビューションの選び方:ゲーミング向けと初心者向けオプションの比較
Linux
54 分前

Jagex がファンを驚かせ、RuneScape: Dragonwilds のアーリーアクセスを即時公開
コンピュータゲーム
2 時間前

Honor Power、驚くほど薄型デザインに搭載された大容量8,000mAhバッテリーでデビュー
スマホ
3 時間前

Beats、Appleの標準オプションを上回るカラフルな充電ケーブルを発売
スマホ
3 時間前

Notion Mail、AI駆動の整理機能を搭載するも統合機能に制限あり
AI
3 時間前

Dune: Awakening、6月10日に延期、5月に大規模ベータウィークエンドを実施予定
コンピュータゲーム
4 時間前

Apple Watch が watchOS 12 アップデートで「Apple Intelligence」機能を搭載へ
ウェアラブルデバイス
4 時間前

Google が AI と Pixel スマートフォンを活用した画期的なイルカとのコミュニケーションプロジェクトを開始
AI
5 時間前

MCP-Shield がモデルコンテキストプロトコルエコシステムの重大なセキュリティギャップを明らかに
セキュリティ
6 時間前

Intel が金融回復戦略の一環として Altera の51%株式を45億米ドルで Silver Lake に売却
Intel
9 時間前

Windows 10 のサポート終了が迫る:残り6ヶ月で選べる5つの選択肢
11 時間前

OnePlus Nord CE5 のリーク情報:大容量7,100mAhバッテリーとDimensity 8350チップを搭載
スマホ
17 時間前

Meilisearch のハイブリッド検索が開発者の間で注目を集める一方、パフォーマンスへの疑問も残る
18 時間前

TypeScript のテンプレートリテラル型がコード生成不要のProtobuf推論を可能にするが、その代償は?
AI
18 時間前

Bungie の Marathon リブートは2025年9月に発売予定、フルプライスではない
コンソールゲーム
21 時間前

Overwatch 2 のスタジアムモードが17ヒーローと革新的な新ゲームプレイ機能でローンチ
コンソールゲーム
22 時間前

Osprey ブラウザ拡張機能のURL確認方法についてプライバシー懸念が浮上
セキュリティ
23 時間前

Skywork-OR1 モデル:オリジナルアーキテクチャではなく微調整された蒸留モデルであるとコミュニティが指摘
AI
昨日

Hacktical C:実用ガイドが現代プログラミングにおけるCの役割について議論を巻き起こす
昨日
