OpenAIを超えた?中国DeepSeekの新AIが示す驚異の問題解決力

中国のAI企業DeepSeekが、新しい大規模言語モデル「R1-Lite-Preview」を公開しました。このモデルはOpenAIの最新モデルと同等以上の性能を持つとされ、特に問題解決能力の高さに注目が集まっています。
本記事では、「R1-Lite-Preview」について詳しく紹介していきますので、ぜひ最後までご覧ください!

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

R1-Lite-Previewの特徴と性能

参照:DeepSerek X

新モデルR1-Lite-Previewの最大の特徴は、問題解決の過程を順を追って示す「思考の連鎖」機能にあります。従来のAIモデルが単に答えを出力するだけだったのに対し、R1-Lite-Previewは「なぜその結論に至ったのか」という思考過程を段階的に説明します。この説明の中には時として、人間には一見無意味に見える思考過程が含まれることもありますが、最終的な解答の精度は非常に高いことが確認されています。
性能面では、アメリカ数学招待試験(AIME)やMATHといった高度な数学試験において、OpenAIの最新モデルを上回る結果を記録しています。また、GPQAと呼ばれる一般的な質問応答テストやCodeforcesというプログラミングコンテストの問題でも、トップレベルの成績を収めています。さらにDeepSeekが公開したデータからは、モデルに思考のための時間(思考トークン)を多く与えるほど、より正確な答えを導き出せることが実証されています。特にAIMEのような数学的な問題において、この特徴が顕著に表れており、回答の正確性と考慮時間の関係を示すグラフでも、その傾向が明確に確認できます!

R1-Lite-Previewの「思考連鎖」の実態

前セクションでも触れましたが、R1-Lite-Previewの「思考連鎖」はどのようなものかを解説していきたいと思います!
質問は「Strawberryという単語にはRの文字が何個あるか」といった、一見単純でも正確な判断が必要なものとします。以下は英語での回答と、日本語で翻訳したものを記載していきます!

英文での回答

参照:VentureBeat

日本語訳
さて、「strawberry」という単語に含まれる「r」の数を数える必要がありますね。まず最初に、単語を正確に確認するべきですね。「Strawberry」。それでは1文字ずつ分けてみます:S-T-R-A-W-B-E-R-R-Y。うーん、これは正しいスペルでしょうか?間違えている可能性があるかもしれません。
スペルをもう一度確認してみます。「strawberry」は「straw」で始まるはずです。「straw」はS-T-R-A-Wで、それに「berry」が続きます。「berry」はB-E-R-R-Y。これを組み合わせると、S-T-R-A-W-B-E-R-R-Yになります。待ってください、これは「r」が多すぎるように感じます。もう一度数えてみます。
最初から始めます:S-T-R-A-W-B-E-R-R-Y。最初の「r」は3文字目にあります。そして次にもう1つ「r」が、終わりの方、「y」の直前にあります。これで「r」は2つですね。でも、もう1つどこかに隠れているのでしょうか?数え間違えているかもしれません。
または、書き出して「r」を1つずつ丸で囲んでみるべきかもしれません。S-T-R-A-W-B-E-R-R-Yを見てみると、最初の「r」は3文字目で、もう1つの「r」は「y」の前にあります。これで「r」は2つですね。でも、どこかにもう1つ隠れている気がします。
ちょっと待ってください、発音について考えてみます。「Strawberry」には真ん中で「r」がダブルで使われる音がありますよね?それって「straw-berry」という感じです。もしかすると、そこにもう1つ「r」があるのでは?もしくは、もっと「r」を含む別の単語と混同している可能性もありますね。
単語 “strawberry” には3つの「r」が含まれています。以下がその内訳です:

  1. “strawberry” のスペルは S-T-R-A-W-B-E-R-R-Y です。
  2. 最初の「r」は3文字目に登場します(”straw”)。
  3. 追加の2つの「r」が単語の後半部分(”berry”)にあります。

したがって、”strawberry” に含まれる「r」の合計は 3つ です。

上記のように推論の過程だけ見ていると、strawberryと数えるだけなぜそこまで考える必要があるのかと思うかもしれませんが、結論に至るまでにどのような思考のステップを踏んだのかが見れることにより、人間もAIの回答に対する是非を判断しやすくなります!
とは言っても、簡単な質問はもう少し端的に結論を出して欲しいなと、せっかちな筆者は感じてしまいました(笑)

現在の提供形態と今後の展開

R1-Lite-Previewは現在、DeepSeek社が運営するウェブサイト「DeepSeek Chat」を通じてのみ提供されており、誰でも無料で利用できる仕組みとなっています。ただし、高度な思考を必要とする「Deep Think」モードには1日50回という利用制限が設けられています。
DeepSeekは中国の定量的ヘッジファンドHigh-Flyer Capital Managementから派生した企業で、高性能なオープンソース技術の開発に力を入れています。これまでも言語処理とプログラミング能力を兼ね備えたモデル「DeepSeek-V2.5」を公開し、その性能の高さから当時のオープンソースAIモデルの中でもトップクラスの評価を受けるなど、オープンソースAIコミュニティへの貢献を重ねてきました。今回のR1-Lite-Previewについても、ソースコード(プログラムの設計図)と開発者向けのインターフェース(API)の公開が予定されており、公式SNSでその方針が示されています。このアプローチは、AIの発展には技術の共有が重要だという同社の理念を反映したものといえます。しかし現時点では、このモデルの構造や訓練方法を説明する技術文書は公開されていません。また、第三者が独自にモデルの性能を検証できる環境も整っていない状況です。そのため開発者コミュニティからは、客観的な性能評価のために必要な情報公開を求める声が上がっており、今後の対応が注目されています!

まとめ

いかがだったでしょうか?
DeepSeekの新しいAIモデルは、問題解決過程の可視化と高い数学的能力という特徴を持ち、その性能の高さが注目を集めています。現時点では利用環境は限定的ですが、同社の過去の実績から、今後技術が広く共有される可能性は高いと考えられます。技術の詳細公開はこれからとなりますが、それによってこのモデルの真価がより明確になっていくことが期待されています。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録