MetaのAI新モデルLlama 3.2とは?特徴と機能を解説

Metaが新しい大規模言語モデル「Llama 3.2」を発表しました。このAIモデルは画像とテキストの両方を理解する能力を持ち、多様な用途に対応できる複数のサイズで提供されています。
本記事ではLlama 3.2の機能と技術的特徴、Meta AIの進化と産業への影響について紹介してきますので、ぜひ最後までご覧ください!

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

Llama 3.2の機能と技術的特徴

Metaは約2ヶ月前にLlama 3.1をリリースし、2ヶ月間でモデルは10倍の成長を遂げたとのことです。そんな中で新たに発表されたLlama 3.2は、その機能をさらに拡張しています。最も注目すべき点は、Llama 3.2が画像とテキストの両方を理解する能力を持つ大規模言語モデル(LLM)になったことです。Llama 3.2は小規模から中規模まで複数のサイズで提供されており、パラメータ数(モデルの複雑さを示す指標)が11Bと90Bの大規模モデルは、グラフや図表の理解、画像へのキャプション付け、自然言語による説明からのオブジェクト特定など、幅広い視覚タスクを処理できます。一方、パラメータ数が1Bと3Bの軽量モデルは、特定のモバイルデバイスやエッジデバイス(ネットワークの端末に位置する機器)での使用に適しており、メッセージの要約や予定調整など、個人向けのAIアプリケーション開発に活用できます。
Llama 3.2は、前モデルと同様に128,000トークンという長いコンテキスト長を持っており、ユーザーは教科書数百ページ分に相当する大量のテキストを入力できます。また、Metaはオープンソース戦略を継続し、開発者向けに「Llamaスタック」と呼ばれるソフトウェアツールやライブラリの一式の配布を開始しています。このスタックにより、開発者はLlama 3.2モデルを自社のサーバー(オンプレミス)、スマートフォンなどの端末(オンデバイス)、クラウドサービス、単一のコンピューター(シングルノード)など、様々な環境で簡単に使用できるようになります。
性能面では、Llama 3.2は画像認識や他の視覚理解タスクにおいて、AnthropicのClaude 3 HaikuやOpenAIのGPT4o-miniと競合するレベルにあるとされています。さらに、指示の遵守、要約、ツールの使用、プロンプトの書き換えなどの分野では、GemmaやPhi 3.5-miniを上回る性能を示しているとのことです。
Llama3.1が登場して以来、さまざまな企業がLlama3.1をベースとして新サービスの開発を行ってきました。それは、MetaがLlamaをオープンソースで公開したことにより、イノベーションが促進されたことを表しています。Llama3.2もオープンソースで提供されるようなので、引き続きイノベーションの波が加速していきそうです!

Meta AIの進化と産業への影響

Meta AIの進化は、ビジネスと一般消費者の両方に影響を与えています。
ビジネス向けには、AIの機能が拡張され、企業がWhatsAppやMessengerでクリックトゥメッセージ広告を活用できるようになりました。これにより、AIが一般的な質問への回答、製品詳細の説明、購入プロセスの完了など、顧客とのやり取りを自動化することが可能になります。Metaの生成AIツールの普及は目覚ましく、100万以上の広告主がこれらのツールを利用しています。先月だけでも1500万件の広告がこれらのAIツールによって作成され、AIを活用した広告キャンペーンは従来の手法と比較してクリック率が11%高く、コンバージョン率が7.6%高いという結果が報告されています。
一般消費者向けには、Meta AIに新たな機能を追加する計画が発表されました。Metaは、Llama 3.2を用いて「声」を持つAIの開発を進めており、ジュディ・デンチやジョン・シナなど有名人の声を模倣して会話する能力の実現を目指しています。将来的には、WhatsApp、Messenger、Facebook、Instagramなどのプラットフォームで、ユーザーが音声またはテキストでAIと対話できるようになる可能性があります。また、Meta AIのマルチモーダル機能の拡張も計画されています。チャットで共有された写真への返信、画像の追加・削除・変更、新しい背景の追加などの機能が検討されています。さらに、翻訳、ビデオ吹き替え、リップシンクなどの新機能も実験中とのことです。
これらの新機能はまだ開発段階にあり、一般公開の時期は明らかにされていません。しかし、これらの技術が実用化されれば、AIとのインタラクションがより自然で多様なものになると期待されています!

まとめ

いかがだったでしょうか?
Metaの新しい大規模言語モデルLlama 3.2は、画像とテキストの理解能力を統合し、AIの応用範囲を拡大しています。ビジネスにおける広告効果の向上や、一般消費者向けの音声対話機能の追加など、様々な分野でAIの活用が進んでいます。これらの技術発展は、私たちの日常生活やビジネス環境に変化をもたらす可能性があり、今後AIがどのように社会に浸透し、どのような影響を与えていくのか、注目していく必要があるでしょう。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録