AIの判断過程が見える!Googleが「Gemini 2.0 Flash Thinking 」発表

Googleが発表した新しい言語モデル「Gemini 2.0 Flash Thinking」は、AIの判断過程を可視化する機能と画像分析機能を備えています。
今月にリリースされたGemini 2.0 Flashと比べて、より強力な推論能力を持つことが開発者向けドキュメントで説明されています。

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

なぜ重要?意思決定プロセスの可視化

Gemini 2.0 Flash Thinkingの最大の特徴は、AIの思考過程を具体的に確認できる点です。従来のAIモデルでは、入力に対してどのような判断を経て結論に至ったのか、その過程を確認することは困難でした。これは「ブラックボックス」として知られる問題でしたが、Gemini 2.0 Flash Thinkingでは、ドロップダウンメニューを通じて、AIの判断過程を順を追って確認することができます。
処理能力面では、一度に32,000トークン(約50-60ページ分のテキスト)の入力に対応し、出力は8,000トークンまで可能です。LM Arenaという独立した第三者機関の分析では、全てのLLMカテゴリーで最高水準の評価を獲得しています。例えば、「Strawberry」という単語内のアルファベット「R」の数を数えるような計算タスクでも、1-3秒以内で正確な結果を出力できることが確認されています。
実際に筆者も試してみましたが、上記の画像のように正確な数字をカウントすることができました!
また、9.9と9.11のような小数の比較では、整数部分の比較から小数点以下の分析まで、システマティックに問題を分解して解決する過程を示すことができます。
現在、Google AI Studio上での利用ではトークンあたりのコストは発生していません。ただし、モデルのトレーニングプロセスやアーキテクチャ、具体的なライセンス条件については現時点で公開されていません。このような判断過程の透明性に加え、画像処理においても新たな特徴を備えています。

画像とテキストを同時に分析できる新機能

Gemini 2.0 Flash Thinkingのもう一つの特徴は、テキストと画像を同時に分析できる機能を最初から搭載している点です。OpenAIのモデルが当初はテキストのみの分析からスタートし、後から画像分析機能を追加したのとは対照的です。実際のテストでは、テキストと視覚的な要素を組み合わせたパズルの解決が可能であることが確認されています。画像分析も試してみましたが、結果としては以下のような回答が得られました。

あえて情報量を多い画像を投げてみましが、結果としては分析の精度はそこまで高くないように感じます。アウトプットでは「TOCK」とう文字が時計盤の上に表示されているとありましたが、確認したところ、何を指しているのか一切分かりませんでした。今回の検証から、画像の分析はシンプルなものでないとうまく機能しない可能性があることがわかりました。
現時点では一部の制限も存在します。開発者向けドキュメントによると、Google検索との連携機能は未実装となっています。また、他のGoogleアプリケーションや外部のサードパーティツールとの統合もまだサポートされていません。出力については、現状ではテキストのみに限定されています。利用方法としては、Google AI StudioまたはVertex AIプラットフォームを通じてアクセスが可能で、開発者はこれらのプラットフォーム上で実験を行うことができます。このように、透明性の高い処理と画像分析機能の組み合わせは、AIモデルの新たな可能性を示しています。

「Gemini 2.0 Flash Thinking」をGoogle AI Studioでご利用されたい方はこちら

まとめ

いかがだったでしょうか?
Gemini 2.0 Flash Thinkingは、AIの判断過程の可視化と、テキストと画像の同時分析機能という特長を備えています。現時点でトークンあたりのコストが発生していない点は、実験的な利用を始める機会となるかもしれません。今後のアップデートや料金体系の発表を待ちつつ、自社の業務における具体的な活用方法を検討してみてはいかがでしょうか。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録