Microsoftが新しいAIモデル「Phi-3.5」シリーズを発表しました。3つの異なるモデルで構成されるこのシリーズは、それぞれが特定のタスクに特化しており、オープンソースで公開されいます。
本記事では、Phi-3.5シリーズの概要と特徴、性能と競合他社との比較、オープンソース戦略とAI開発コミュニティへの影響について解説していきます。ぜひ最後までご覧ください!
ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
ボタンから募集中の求人一覧ページに移動できます。
Phi-3.5シリーズの概要と特徴
Phi-3.5シリーズは、「Phi-3.5-mini-instruct」「Phi-3.5-MoE-instruct」「Phi-3.5-vision-instruct」の3つのモデルで構成されています。「Phi-3.5-mini-instruct」は3.82億のパラメータを持ち、基本的な推論や高速な処理が必要なタスクに適しています。「Phi-3.5-MoE-instruct」は41.9億のパラメータを持つ大規模モデルで、複雑な推論タスクや多言語処理に特化しています。そして「Phi-3.5-vision-instruct」は4.15億のパラメータを持つマルチモーダルモデルで、画像や動画の処理が可能です。
これら3つのモデルはいずれも128,000トークンという長いコンテキスト長をサポートしており、複雑で長文の入力や多フレームの視覚タスクを処理できる能力を持っています。Phi-3.5シリーズの特筆すべき点は、その効率性です。例えば、MoEモデルは419億のパラメータを持ちながら、実際の動作時には66億のパラメータのみを使用することで、大規模モデルの能力を維持しつつ効率的な処理を実現しています。
最近はOpen AIやAnthropic、Metaの勢いが強かったですが、ここにきてMicrosoftもオープンソースモデルで対抗してきましたね!他のシリーズと比較した際に性能はどうなのかを次のセクションで解説していきたいと思います!
Phi-3.5シリーズの性能と競合他社との比較
参照:Venture Beat(以下のグラフも同様)
Phi-3.5シリーズは複数のベンチマークテストで優れた性能を示しており、特に注目すべきはRepoQAベンチマークにおける成績です。このベンチマークは長文脈でのコード理解能力を測定するもので、Phi-3.5 Mini InstructモデルはLlama-3.1-8B-instructやMistral-7B-instructなど、同等サイズの他のモデルを上回る成績を収めています。
また、Phi-3.5 MoEモデルはMMLU(Massive Multitask Language Understanding)ベンチマークにおいて、OpenAIのGPT-4ominiを上回る成績を達成しました。このベンチマークはSTEM(科学・技術・工学・数学)、人文科学、社会科学など、幅広い分野にわたる理解力を測定するものです。多言語処理においても、Phi-3.5シリーズはGoogleのGemini 1.5 FlashやMetaのLlama 3.1と競合する性能を示しており、視覚的タスクでは、Phi-3.5 Vision Instructモデルが一般的な画像理解から複雑なグラフや表の解析まで、幅広い能力を発揮しています。ただし、これらの比較結果は特定のベンチマークや条件下での評価であり、実際の応用場面では性能が変わる可能性があることに注意が必要です。
全ての指標ではないにせよ、GPT-4o miniやLlama-3.1-8B-instructを上回るとなると、性能はかなり高いことがわかります。ベンチマークだけで見ると、コード理解や言語、画像、学問分野など幅広い領域で上位に食い込んできていることがわかります。今後に期待を持てるサービスとなりそうです!
オープンソース戦略とAI開発コミュニティへの影響
MicrosoftはPhi-3.5シリーズを最も寛容なオープンソースライセンスの一つであるMITライセンスの下で公開しました。このライセンスにより、開発者は自由にソフトウェアを使用、改変、配布することができ、商用利用も許可されています。つまり、Phi-3.5シリーズのモデルを基にして、企業や個人が独自のAIアプリケーションを開発し、それを商用化することが可能となります。これらのモデルはHugging Faceプラットフォームを通じて開発者がダウンロード、使用、カスタマイズすることができ、この戦略により、より多くの開発者や研究者がこの先進的な技術にアクセスできるようになり、AI技術の普及と発展に貢献することが期待されます。
オープンソースで提供してくれることによって、日本語に特化したバージョンや、特定の専門領域に特化したバージョンが作られます。Microsoftには頭が上がりませんね。商標利用も可能ということなので、開発者の方はぜひチェックしてみてください!
まとめ
いかがだったでしょうか?
MicrosoftのPhi-3.5シリーズの発表は、AI技術の発展において重要な一歩となります。これらのモデルは高い性能と効率性を併せ持ち、多様なタスクに対応できる柔軟性を示しています。さらに、オープンソースでの公開はAI開発の裾野を広げ、より多くの人々がAI技術を活用できる環境を作り出します。今後、Phi-3.5シリーズがAI業界と社会全体にどのような影響を与えていくか、注目していく価値があります!
ARCHETYP Staffingではクリエイターを募集しています!
私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!
ボタンから募集中の求人一覧ページに移動できます。