昨年から、ChatGPTやClaude、Geminiなど、人間のように自然な会話ができる大規模言語モデル(LLM)をベースとしたチャットボットAIが数多く登場しています。これらのAIは、日常の会話から専門的な議論まで、幅広い分野で活躍しています。しかし、これらのAIの「知能」が人間のそれとどの程度匹敵するのか、疑問に思っている方もいるのではないでしょうか?
このたび、Anthropicが開発したAIモデル「Claude-3」が、AIとしては史上初めてIQテストで人間の平均的な知能指数である100を超えるスコアを達成しました。
この記事では、IQテストの比較や結果について詳しく解説していきますので、ぜひ最後まで読んでみてください!
レポートはこちら
Claude-3については以下の記事で詳しく解説しています:
Claude 3が登場! GPT-4を上回る日本語対応マルチモーダルAIを解説
ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
ボタンから募集中の求人一覧ページに移動できます。
IQテストの実施と結果
AIの知能を人間のものと比較する試みとして、テレビプロデューサー兼レポーターのマキシム・ロット氏は、複数のチャットボットAIに対してノルウェー・メンサのIQテストを実施しました。
このテストは2回行われ、その平均スコアからAIの推定IQが算出されました。結果として、Anthropicによって開発された最新のAIモデル「Claude-3」が101の推定IQを記録し、人間の平均IQに匹敵する、またはそれを超える数値を出しました。一方で、OpenAIのChatGPT-4は85の推定IQを記録し、Claude-3に次いで高い成績を収めましたが、Claude-3ほどのスコアは出ませんでした。
Bing Copilot、Gemini、Grok、Llama-2などの他のAIもテストを行いましたが、これらのAIはClaude-3やChatGPT-4と比較して低いスコアに留まりました。
このように、数年前はAIが人間の知能やIQを超えるのには、数十年かかると言われていましたが、今回の結果だけを見ると、ついに人間と同等のレベルになってきたことがわかります。
AIのIQスコアと人間のIQ
先ほどのセクションで、Claude-3がIQテストで人間の平均IQに匹敵するスコアを達成したことを紹介しましたが、IQテストだけで全てを判断するのは注意が必要です。
そもそもIQテストは、人間の論理的思考、問題解決能力、言語理解能力などを測定するために設計されていますので、AIがこのようなテストで高いスコアを出したとしても、それがAIが人間と同じように思考や感情を持っていることを意味するわけではありません。
ですので、人間のIQが、教育、環境、文化的背景など多様な要因に影響を受けるため、IQスコアだけで個人の全能力を評価することができないのと同様に、AIのIQスコアも、AIが持つ論理的解決能力や知識の広さを示す指標の一つに過ぎず、AIの「知性」や「意識」を全面的に測定しているわけではないことを理解することが重要です。
まとめ
いかがだったでしょうか?
昨年からAIの進化スピードはとても早く、今後はAIエージェントやAGIの登場も予想されますので、引き続き動向を追っていきましょう!
Claude-3については以下の記事で詳しく解説しています:
Claude 3が登場! GPT-4を上回る日本語対応マルチモーダルAIを解説
ARCHETYP Staffingではクリエイターを募集しています!
私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!
ボタンから募集中の求人一覧ページに移動できます。