企業の業務システムにおいて、複数のAIエージェントを効率的に管理・制御する基盤の必要性が高まっています。Microsoftは、この課題に対応する新しいフレームワーク「Magnetic-One」を公開しました。
本記事では、Magnetic-Oneのアーキテクチャ構成、実装におけるLLMの柔軟性と技術的特徴について解説していきますので、ぜひ最後までご覧ください!
ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
ボタンから募集中の求人一覧ページに移動できます。
Magnetic-Oneのアーキテクチャ構成
Magnetic-Oneは、複数のAIエージェントが協力して複雑な業務タスクを遂行できるよう設計された統合管理フレームワークです。このシステムの特徴は、中央で全体を管理する1つの管理エージェントと、特定の役割を担う4つの実行エージェントという明確な階層構造にあります。
システムの中核となるのが「オーケストレーターエージェント」です。オーケストレーターとは、複数のシステムやプログラムを指揮者のように統括して管理・制御する役割を持つコンポーネントを指します。このエージェントは、4種類の特化型エージェントを統括し、それぞれに適切な指示を出す司令塔としての役割を担います。タスクの実行にあたり、オーケストレーターはまず「タスク台帳」という形で実行計画を作成します。この台帳には、各エージェントの作業順序や具体的なワークフローが記録され、作業の進行に合わせて「進捗台帳」として更新されていきます。これにより、各タスクの完了状況を継続的に監視し、エージェントが作業で行き詰まった場合には、新しい実行計画を立て直すことも可能です。
オーケストレーターが指揮する4種類の特化型エージェントは、それぞれ以下のような役割を担っています:
Websurferエージェント:
GoogleChromeなどの基盤となっているChromiumベースのブラウザを操作し、ウェブサイトの閲覧や検索を行います。クリックやタイピング操作が可能で、閲覧したコンテンツの要約機能も備えています。
FileSurferエージェント:
ローカル環境のファイルシステムを操作します。ファイルの読み取り、ディレクトリの一覧表示、フォルダ内の検索といった基本的なファイル操作を担当します。
Coderエージェント:
プログラムコードの作成を担当します。他のエージェントから得た情報を分析し、必要な成果物を生成する役割も果たします。
ComputerTerminalエージェント:
プログラムを実行し、その結果をテキストベースで表示するコンソール(コマンドライン画面)環境を提供します。Coderエージェントが作成したプログラムを実行し、その結果を確認することができます。
このフレームワークの導入と同時に、Microsoftは「AutoGenBench」というエージェントシステムの評価ツールも公開しています。これは、複数のAIエージェント間でのコミュニケーションと協力を実現するための基盤システムである「Autogenフレームワーク」を基に構築されたツールで、エージェントシステムの性能評価やテストを効率的に行うことを可能にします。
このようにMagnetic-Oneは、明確な役割分担と階層構造により、複雑なタスクを効率的に処理する基盤を提供しています。では次に、このシステムがどのように異なる言語モデルと連携し、実際の業務に活用できるのか、その技術的な特徴を見ていきましょう!
実装におけるLLMの柔軟性と技術的特徴
Magnetic-Oneの技術的な特徴として注目すべきなのが、特定の言語モデル(LLM:Large Language Model)に依存しない柔軟な設計思想です。Microsoftの開発チームはGPT-4oを用いて開発を進めましたが、システムとしては様々な言語モデルを組み合わせて利用することができます。
各エージェントには、タスクの性質に応じて異なる言語モデルを割り当てることが可能です。実際に研究チームは、タスク全体の実行状況を監視・制御する処理サイクル(外部ループ)とCoderエージェントにはOpenAI 01-previewを使用し、他のエージェントにはGPT-4oを使用するといった異なるモデルの組み合わせでのテストも行っています。
企業向けのAIエージェント管理システムとしては、すでにOpenAIのSwarmフレームワークやCrewAIのマルチエージェントビルダー、LangChainなどが存在していますが、Magnetic-Oneはこれらの中でもエージェント間の連携に重点を置いた設計となっています。具体的な活用例として、S&P 500の市場動向分析や文献の引用管理、日常的なタスク処理などが報告されており、組織の要件や予算に応じて最適なLLMの組み合わせを選択できる柔軟性を備えています。ただし、複雑なタスク管理と判断を担うオーケストレーターエージェントについては、与えられた情報から論理的な判断や予測を行える高性能な推論モデルの使用が推奨されています。
Magnetic-Oneは豊富なカスタマイズ性とモデル選択の自由度を提供しながら、実用的なタスク処理を実現する基盤として機能します。特に、異なる言語モデルを組み合わせて利用できる柔軟な設計は、企業の多様なニーズに対応する重要な特徴といえるでしょう!
OpenAIのSwarmフレームワークについては過去の記事でも紹介していますので、合わせてご覧ください:
OpenAIの新構想!複数AI連携システム「Swarm」とは
まとめ
いかがだったでしょうか?
Magnetic-Oneは、複数のAIエージェントを統合的に管理するための基盤として、オーケストレーターを中心とした明確なアーキテクチャと柔軟なLLM選択の自由度を提供しています。システムはオープンソースで公開されており、開発者は独自の用途に合わせてカスタマイズすることができます。専門家の間では、今後の企業での実装事例の増加に伴い、より具体的な活用方法や最適な構成が明らかになっていくと予測されています。
ARCHETYP Staffingではクリエイターを募集しています!
私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!
ボタンから募集中の求人一覧ページに移動できます。