OpenAI AgentKitとは?エージェント構築を簡単にする3つのツール

OpenAIが新たに発表した「AgentKit」は、AIエージェントの構築から運用までを一気通貫で支援するツールセットです。これまで開発者たちが何週間もかけて組み立てていた作業が、視覚的な操作だけで数時間に短縮される。そんな変化が、いま静かに始まっています。

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

エージェント開発は、なぜこれほど複雑だったのか

AIエージェントを実際に動かすまでには、想像以上に多くの工程が必要でした。複数のツールを組み合わせ、データの流れを設計し、どのタイミングで何をさせるかを細かく指示する「オーケストレーション」と呼ばれる作業が必要になります。しかもこの設計にはバージョン管理の仕組みがなく、変更履歴を追うことさえ困難でした。さらに外部のサービスやデータベースと連携させるには「カスタムコネクタ」を一つひとつ手作業で構築しなければならず、エージェントがきちんと動いているかを確認する評価パイプラインも手動で組む必要があります。そしてようやく動くようになったとしても、ユーザーが使えるインターフェースを作るには、さらに数週間のフロントエンド開発が待っているのです。
こうした複雑さが、エージェント開発を専門のエンジニアだけのものにしていました。しかし同時に、エージェントの可能性も証明されつつありました。決済サービス企業Klarna社は顧客サポートの全チケットの3分の2を処理するエージェントを構築し、営業支援ツールのClay社は成長を10倍に伸ばしています。OpenAIは3月にResponses APIAgents SDKをリリースし、開発者たちがエンドツーエンドのエージェントワークフローを組めるようにしました。そしていま、AgentKitの登場です。狙いは明確でした。これまで断片化していたツール群を統合し、開発にかかる時間と手間を大幅に減らすこと。
では、AgentKitは具体的にどんな形でこの課題を解決しようとしているのでしょうか。

Agent BuilderとChatKit─”見える化”と”埋め込み”の力

AgentKitの中核を担うのが「Agent Builder」です。これはエージェントのワークフローを視覚的に設計できるキャンバスで、ノード(各処理を表すブロック)をドラッグ&ドロップで配置し、線でつないでいくだけで動作フローを組み立てられます。コードを書く必要はありません。プレビュー実行もその場で試せますし、すべてのバージョンが記録されるため、過去の設計に戻ることも、変更の経緯を確認することも簡単になりました。
実際の導入例が、この変化を物語っています。法人向け経費管理サービスのRamp社では、Agent Builderを使って購買エージェントをわずか数時間で構築しました。同社は「反復サイクルを70%短縮でき、エージェントを2四半期ではなく2スプリントで稼働させることができた」と述べています。日本企業のLINEヤフー株式会社も、業務アシスタントエージェントを2時間以内に構築しました。かつて数か月かかっていた作業が、いまや数時間で完了する時代になったのです。
企業向けには「Connector Registry」も用意されています。複数のワークスペースや組織にまたがるデータソースを一元管理するための管理パネルで、Dropbox、Google Drive、Sharepoint、Microsoft Teamsといったコネクタを統合できます。安全性の面では「Guardrails」という仕組みも導入されており、個人情報をマスクしたり、不正な指示(ジェイルブレイク)を検出したりする機能を持っています。
そしてもう一つ忘れてはならないのが「ChatKit」です。エージェントを実際にユーザーが使えるようにするには、チャット画面が必要になります。ストリーミングで返ってくる応答の処理、会話の履歴管理、エージェントが考えている様子の表示。これらの機能を一つひとつ実装するのは意外と大変な作業でした。ChatKitを使えば、チャットベースのエージェント体験を簡単に自社のアプリやウェブサイトに組み込めます。エージェントを作った後の「どうやってユーザーに届けるか」という最後のハードルも、これで越えられるようになりました。
ただ、エージェントを動かすだけでは終わりません。本当に使えるものにするには、もう一つ大切なプロセスがあります。

見えないところで働く”評価”と”最適化”の仕組み

エージェントを作っただけでは、まだ完成ではありません。本当に重要なのは「ちゃんと動いているか」を確認し、改善を繰り返すことです。OpenAIは昨年、プロンプトをテストしてモデルの動作を測定するための「Evals」という機能をリリースしました。そして今回、AgentKitの発表に合わせて、この評価機能に4つの新しい要素が追加されています。
1つ目は「データセット」です。ゼロから評価用のデータセットを素早く構築でき、自動評価と人間による注釈を組み合わせながら拡張していけます。2つ目は「トレース評価」で、エージェントワークフローのエンドツーエンド評価を実行し、弱点をピンポイントで特定します。3つ目は「自動プロンプト最適化」で、人間が付けた注釈や評価結果をもとに、改善されたプロンプトを生成してくれます。4つ目は「サードパーティモデルサポート」です。OpenAI以外のモデルも評価でき、複数のモデルを比較しながら最適なものを選べるようになりました。さらに、推論モデルをカスタマイズできる「強化学習ファインチューニング(RFT)」も提供されています。今回、RFTベータ版には2つの新機能が追加されました。1つは「カスタムツール呼び出し」で、エージェントが適切なタイミングで適切なツールを呼び出せるようモデルを訓練できます。もう1つは「カスタムグレーダー」で、自分たちのユースケースにとって何が最も重要かを基準に、独自の評価基準を設定できます。
こうした評価と最適化の仕組みは、ユーザーの目には見えません。しかし実は、エージェントが実際の業務で使えるレベルに達するかどうかは、この地道な積み重ねにこそかかっているのです。AgentKitは華やかな表側だけでなく、地味だが本質的な裏側の仕組みにも、しっかりと手を入れています。エージェントという技術が本当に使えるものになるための、最後のピースがここにあります。

まとめ

いかがだったでしょうか?
AgentKitの登場により、エージェント開発の敷居は大きく下がりました。ChatKitと新しいEvals機能は本日からすべての開発者に一般提供され、Agent Builderはベータ版として利用可能です。価格は標準のAPIモデル料金に含まれます。OpenAIは近日中に、スタンドアロンのWorkflows APIとChatGPTへのエージェントデプロイオプションも追加予定としています。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録