DeepSeek-R1、OpenAI o1に匹敵!コスト95%減のオープンソースAI

中国のAIスタートアップDeepSeekが新しい言語モデル「DeepSeek-R1」を発表しました。
OpenAIが開発した最新モデル「o1」と同等の性能を持ちながら、利用コストを95%削減することに成功。さらに、オープンソースとして公開されたことで、誰もが自由に利用・改良できる環境が整いました。

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

独自の強化学習手法による性能の実現

DeepSeek-R1は、DeepSeek V3の混合エキスパートモデルをベースとして開発されました。従来の教師あり学習とは異なり、AIが試行錯誤を繰り返しながらより良い結果を導き出す「強化学習」を中心としたアプローチを採用している点が、このモデルの大きな特徴です。
開発はまず、DeepSeek-R1-Zeroと呼ばれるモデルの作成から始まりました。人間が用意した教師データを一切使用せず、純粋な強化学習のみで訓練を行ったこのモデルは、数千回の学習を経て複雑な推論タスクを解決できるようになり、AIME 2024という数学テストのスコアを15.6%から71.0%まで向上させることに成功しました。しかし、初期のDeepSeek-R1-Zeroには文章の可読性が低く、複数の言語が混ざってしまうという課題がありました。そこでDeepSeekは強化学習と教師あり学習を組み合わせた多段階の学習プロセスを導入。まず数千件の初期データでDeepSeek V3を調整し、その後で強化学習を実施、さらに執筆や質疑応答などの分野で教師あり学習を追加することで、これらの課題を克服しました。この改良の結果、次に説明する実用的なベンチマークでも高い評価を得ることができました。

実用的なベンチマークでの評価結果

DeepSeek-R1の性能評価は、数学、プログラミング、一般知識という3つの分野で実施されました。数学分野では、アメリカ数学競技会(AIME)2024年版と呼ばれる高度な試験で79.8%のスコアを達成し、数学の問題解決能力を測定するMATH-500では97.3%という高い正答率を記録。これらの数値は、OpenAIのo1モデルの成績(それぞれ79.2%、96.4%)と同等かそれ以上の結果となっています。
プログラミング能力の評価では、競技プログラミングプラットフォーム「Codeforces」でのテストに挑戦。DeepSeek-R1は2,029のレーティングを獲得し、このプラットフォームに参加する人間のプログラマーの96.3%を上回る成績を示しました。また、幅広い分野の知識を評価する総合的なベンチマークとして知られるMMLUテストでは、歴史、科学、法律など多岐にわたる問題に対して90.8%の正答率を記録。これはOpenAIのo1が達成した91.8%に迫る結果です。
このような高い性能評価結果は、次に説明する実務活用への大きな可能性を示唆しています。

実務での活用に向けた展望

実務活用において最も注目されるのは、そのコスト面での優位性です。OpenAIのo1モデルが入力100万トークンあたり15ドル、出力100万トークンあたり60ドルを要するのに対し、DeepSeek-R1をベースとしたDeepSeek Reasonerは、それぞれ0.55ドルと2.19ドルで利用可能です。この大幅なコスト削減は、特に大規模なデータ処理や継続的な利用を検討する企業にとって、重要な選択要因になると考えられます。
利用方法は、ユーザーのニーズに応じて3つの選択肢が用意されています。ChatGPTに相当するDeepSeekのチャットプラットフォーム「DeepThink」としての利用、Hugging Faceを通じたモデルの重みとコードの直接取得、そしてAPIを介した既存システムへの統合です。ソフトウェアの自由な使用、改変、再配布を認めるMIT licenseの下でオープンソース化されており、商用利用を含むあらゆる用途で自由な利用が可能となっています。」
実際の活用例として、DeepSeekはこのモデルを用いてLlamaとQwenという既存の言語モデルの性能向上も実現しました。特に、比較的小規模なQwen-1.5Bモデルが、特定の数学ベンチマークにおいてGPT-4oやClaude 3.5 Sonnetといった大規模モデルを上回る結果を示したことは、今後の実用面での可能性を大きく広げる成果といえるでしょう。

まとめ

いかがだったでしょうか?
DeepSeek-R1は、強化学習を中心とした独自の開発手法により、高度な推論能力を実現しています。OpenAIのo1モデルと同等の性能を持ちながら、コストを大幅に抑えることに成功。さらに、オープンソースとしての公開により、開発者が独自の改良や機能追加を行える環境が整ったことで、今後はより多くの実践的な活用事例が生まれることが期待されます。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録