
複数のAIが協力して、一つのAIでは解決できない問題を解く時代が到来しました。日本のSakana AIが発表したTreeQuestは、異なる特性を持つ大規模言語モデル同士を連携させ、個別モデルを30%上回る性能を実現する技術です。各AIの得意分野を見極めて最適な役割分担を行うこの手法が、AI活用の常識を変えていきます。
ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
ボタンから募集中の求人一覧ページに移動できます。
AIの「得意・不得意」を活かすチームワーク戦略

現在のAI市場では、各大規模言語モデル(LLM)が独自の特性を持っています。あるモデルはコーディングに優れ、別のモデルは創作活動で力を発揮する。これまで企業や個人は一つのプロバイダーやモデルを選択し、その範囲内で作業を行うしかありませんでした。ところがSakana AIが開発したMulti-LLM AB-MCTSは、この制約を根本から覆します。AB-MCTSとは「適応分岐モンテカルロ木探索」の略称で、DeepMindのAlphaGoでも使われた意思決定アルゴリズムを応用したものです。
この技術の核心にあるのは「推論時スケーリング」という考え方。従来のAI開発では、モデルを大きくして大量のデータで訓練する「訓練時スケーリング」が主流でしたが、推論時スケーリングでは既に完成したモデルに対して、答えを出す際により多くの計算資源と時間を割り当てることで性能を向上させます。代表的な手法として、強化学習を使ってモデルにより長く詳細な思考連鎖を生成させる方法があり、OpenAI o3やDeepSeek-R1のような人気モデルでも使われています。もう一つのシンプルな方法は「反復サンプリング」で、同じ問題に対して複数回異なる回答を生成し、最適解を選び出すアプローチです。Multi-LLM AB-MCTSは、これらの概念をさらに発展させたもの。システムは「より深く検索する」か「より広く検索する」かを確率モデルで判断します。深く検索するとは有望な回答を繰り返し改良することを意味し、広く検索するとは全く新しいアプローチで解決策を生成することです。
さらに画期的なのは、システムが「何をすべきか」だけでなく「どのLLMが最適か」も同時に判断すること。タスク開始時点では、どのモデルが問題に適しているかわからないため、バランス良く複数のLLMを試しながら、どのモデルがより効果的かを学習し、時間の経過とともに優秀なモデルにより多くの作業を割り当てるようになります。秋葉拓哉氏は「従来の反復サンプリングのより賢く戦略的なバージョン」と説明し、「動的に検索戦略と適切なLLMを選択することで、限られた呼び出し回数内で性能を最大化する」と述べています。
では、この理論が実際にどれほどの威力を発揮するのでしょうか。
実証された「集合知」の威力と実用化への道筋

理論の有効性を証明するため、Sakana AIの研究チームはARC-AGI-2ベンチマークで検証を行いました。ARCは「抽象化・推論コーパス」の略称で、人間のような視覚的推論能力をテストする極めて困難な課題として知られ、AIにとって悪名高い分野です。
実験では、o4-mini、Gemini 2.5 Pro、DeepSeek-R1という3つの最先端モデルを組み合わせました。結果は驚くべきもので、モデルの集合体は120問中30%以上で正解を導き出し、個別のモデルが単独で動作した場合を大幅に上回る成果を記録したのです。
最も印象的だったのは、単一モデルでは解決不可能だった問題を、複数モデルの連携によって解決できた事例でした。ある問題では、o4-miniが生成した解答に誤りがありましたが、システムがこの不完全な回答をDeepSeek-R1とGemini 2.5 Proに渡すと、これらのモデルがエラーを分析し、修正を加えて最終的に正しい答えを導き出しました。研究者たちは「以前は解決不可能だった問題を解決し、LLMを集合知として使用することで達成可能な限界を押し広げる」と成果を評価しています。
この成果を受けて、Sakana AIはTreeQuestという名前でアルゴリズムをオープンソース化。Apache 2.0ライセンスのもとで公開されており、商用利用も可能です。TreeQuestは柔軟なAPIを提供し、開発者が独自のタスクにMulti-LLM AB-MCTSを適用できる環境を整えています。
実用面での応用について、秋葉氏は具体的な可能性を示しています。「各モデルの幻覚(ハルシネーション)を起こす傾向は大きく異なるため、幻覚の少ないモデルとのアンサンブルによって、強力な論理的能力と信頼性の両方を実現できる」と述べています。幻覚とは、AIが事実でない情報を生成してしまう現象で、ビジネス環境では重要な課題となっているため、この特性は非常に価値があります。
研究チームは既に、ARC-AGI-2以外の分野でも成功を収めており、複雑なアルゴリズムコーディングや機械学習モデルの精度向上といった領域でAB-MCTSを適用し、良好な結果を得ました。さらに秋葉氏は「既存ソフトウェアの性能メトリクス最適化など、反復的な試行錯誤を必要とする問題に効果的」と語り、「ウェブサービスの応答遅延を改善する方法を自動的に見つける用途」などの具体例を挙げています。
オープンソースの実用的なツールが登場したことで、より強力で信頼性の高い企業向けAIアプリケーションの新しい扉が開かれました。
まとめ

いかがだったでしょうか?
Sakana AIのTreeQuestは、複数のAIモデルが持つ異なる特性を組み合わせることで、単一モデルの限界を超える新しいアプローチを示しました。各モデルの得意分野を動的に判断し、最適な役割分担を行うこの技術は、30%という具体的な性能向上を実現しています。オープンソース化により、企業や開発者が実際に活用できる環境も整いました。AI活用において「一つのプロバイダーに依存する」という従来の選択肢に加えて、「複数のモデルを協調させる」という新たな手法が生まれつつあります。このようなマルチモデル連携が、今後のAIソリューションにどのような変化をもたらすか、その展開に注目が集まります。
ARCHETYP Staffingではクリエイターを募集しています!
私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!
ボタンから募集中の求人一覧ページに移動できます。