
コンピュータの世界で、まったく新しい出来事が起きています。これまでAIを賢くするには、膨大なデータと時間、そして莫大な費用をかけて一から訓練し直す必要がありました。しかし日本のSakana AIが開発したM2N2という技術は、まるで生物の進化のように、既存のAIモデル同士を掛け合わせて、より優秀な新しいモデルを生み出します。
ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
ボタンから募集中の求人一覧ページに移動できます。
「まるで生物の進化」- M2N2が実現する新しいAI開発手法

これまでのAI開発は一筋縄ではいかない作業でした。新しい能力を持つAIを作るには大量のデータを集め、強力なコンピュータで何日も何週間もかけて学習させる必要があります。さらに既存のAIに新しいスキルを教えようとすると、以前覚えた知識を忘れてしまう「破滅的忘却」という現象が起きてしまうのです。
M2N2(Model Merging of Natural Niches)は、複数の専門AIの知識を一つに統合する「モデル統合」という技術を、自然界の生物進化にならって自動化しました。従来のAI訓練では「勾配更新」という複雑で時間のかかる計算処理が必要でしたが、M2N2は既存のAIモデルの重み(学習済みの情報)を組み合わせるだけなので、はるかに少ない計算量で済みます。つまり、新しいAIを作るのに必要な時間とコストを大幅に削減できるのです。
従来のモデル統合では、開発者が手作業で固定された層やブロックといった境界を設定し、「どの部分をどのように組み合わせるか」を決めていました。ところがM2N2は3つの画期的な特徴でこの制限を突破します。
まず、固定的な統合境界を完全に排除しました。一つの層の中でも「30%はモデルA、70%はモデルB」といった柔軟な「分割点」と「混合比」を使って自動で組み合わせを試すのです。仕組みは次のようになります。
最初に複数の基となるAIモデル(シードモデル)を集めた保管庫のような場所を用意します。そこから毎回2つのモデルを選んで統合を試し、もし良い結果が出れば、性能の劣るモデルを新しい統合モデルと入れ替えるのです。この繰り返しによって、だんだんと優秀なモデルばかりが残っていきます。
次に、競争を通じてモデル集団の多様性を管理します。研究者らは試験の答案用紙で例えています。同じ答えが書かれた2枚の答案用紙を合わせても意味がありませんが、それぞれ異なる問題の正解を持つ答案用紙同士なら、統合することで完璧な答案用紙ができあがるというわけです。M2N2は限られたリソースをめぐる競争をシミュレートして、ユニークなスキルを持つニッチな専門家モデルを自然に見つけ出します。
最後に「引力」と呼ばれるヒューリスティックで、お互いの弱点を補完し合えるモデル同士をペアにします。単純に上位モデル同士を組み合わせるのではなく、一方が得意なデータポイントをもう一方が苦手とする組み合わせを狙い撃ちするのです。
では実際に、このM2N2理論がどれほどの威力を発揮したのでしょうか。
実証された可能性 – 画像認識から言語処理まで

M2N2の真価は、3つの全く異なる分野での実験結果によって証明されました。
最初の実験では、手書き数字を認識するMNIST(手書き数字画像の標準的なデータセット)を使って、画像を分類するAIをゼロから作り上げました。M2N2は他の手法と比較して大幅に高い認識精度を達成し、それぞれ異なる得意分野を持つモデルを保管庫に維持することで、効果的な統合を可能にすることを実証したのです。
より実用的な挑戦として、大規模言語モデル(LLM)の統合実験が行われました。数学問題の解答が得意なWizardMath-7Bと、ウェブ上でのタスク実行に特化したAgentEvol-7B(両方ともLlama 2アーキテクチャベース)を組み合わせたのです。目標は数学問題(GSM8Kデータセット)とウェブベースタスク(WebShopデータセット)の両方に優れた単一エージェントの作成でした。結果として得られたモデルは両方のベンチマークで強い性能を達成し、一つのAIで複数の専門性を実現できることを示しました。
最も驚くべき成果は、拡散ベースの画像生成モデルの統合実験でした。研究チームは日本語プロンプトで訓練されたJSDXLと、主に英語プロンプトで訓練された3つのStable Diffusionモデルを統合しました。目標は日本語理解能力を保持しながら、各シードモデルの最高の画像生成能力を組み合わせることでした。結果は研究者の予想を遥かに超えるものでした。統合モデルは、より写実的で意味理解に優れた画像を生成するだけでなく、創発的なバイリンガル能力を発達させたのです。日本語キャプションのみを使用して最適化されていたにも関わらず、英語と日本語両方のプロンプトから高品質な画像を生成できるようになりました。まさに予期せぬ進化が起こったのです。
論文の著者らは、すでに専門モデルを開発している企業にとってのビジネスケースが説得力を持つと指摘しています。例えば、説得力のある営業ピッチ用に微調整されたLLMと、顧客の反応を解釈するよう訓練されたビジョンモデルを統合すれば、ライブビデオフィードバックに基づいてリアルタイムでピッチを適応させる単一エージェントの作成が可能になります。複数のモデルの統合された知能を、単一モデル実行のコストとレイテンシで活用できるという、まさに一石二鳥の成果です。
これらの実験結果が示すのは、M2N2が単なる理論ではなく、実際に新たな価値を生み出せる実用的な技術であるということです。
まとめ

いかがだったでしょうか?
M2N2が示すのは、AIモデルを一から作り直すのではなく、既存の優秀なモデル同士を組み合わせて新しい能力を生み出す可能性です。研究者らは将来、組織が新しい課題に適応するために継続的に進化し統合するAIモデルの完全なエコシステムを維持する未来を想像していると述べています。ただし最大の課題は技術的なものではなく組織的なものです。オープンソース、商用、カスタムコンポーネントで構成される大規模な統合モデルがある世界では、プライバシー、セキュリティ、コンプライアンスの確保が重要な問題となります。企業にとっての真の挑戦は、進化するAI環境にどのモデルを安全かつ効果的に吸収できるかを見極めることになるでしょう。
ARCHETYP Staffingではクリエイターを募集しています!
私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!
ボタンから募集中の求人一覧ページに移動できます。