Amazonが開発したブラウザ操作AI「Nova Act」の可能性

Amazonが「Nova Act」という新たなAIモデルを発表しました。このモデルはウェブブラウザ内でタスクを自動実行できる技術です。開発者向けSDKの研究プレビュー版が公開され、ブラウザ内で複雑なタスクを自動化するエージェントの構築が可能になります。
この技術が私たちの日常やビジネスをどう変えるのか見ていきましょう。

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

ブラウザで行動するAIエージェント – Nova Actの真価

大規模言語モデル(LLM)が登場して以来、「AIエージェント」は主に言葉で応答したり知識ベースを検索するシステムでした。しかしAmazonのNova Actは、これを一歩先へ進め、単なる会話から実際の行動へとAIの役割を拡張します。
これまでのAIエージェントには明確な限界がありました。APIが用意されたサービスでしか動作せず、複雑なタスクには常に人間の監視が必要だったのです。Nova Actはこの壁を破り、複雑な作業を信頼性の高い基本コマンドに分解して処理できます。例えば、社内システムでの休暇申請、カレンダー設定、自動返信メールの設定といった一連の作業を自動で完了させることができます。Amazonはさらに野心的な目標として、結婚式の企画や複雑なIT業務など、多段階の判断が必要な作業の自動化も視野に入れています。
Nova Act SDKの強みは、その柔軟な構成能力にあります。開発者は検索やフォーム入力などの基本操作を組み合わせるだけでなく、「この広告はスキップする」といった細かい指示も追加できます。Playwrightというツールを通じてブラウザを直接操作することも可能で、パスワード入力などのセキュアな処理も安全に行えます。さらに、Nova ActはPython言語と統合されており、テスト機能やブレークポイント、並列処理などのプログラミング技術をエージェントに組み込めます。これによりウェブサイトの読み込み時間などの現実的な制約にも効率的に対応でき、実用的なアプリケーション開発の土台が整いました。

実用化への道筋と未来展望

Nova Actの最大の強みは、その高い信頼性です。従来のAIエージェントがウェブ操作で30〜60%の成功率しか達成できないのに対し、Nova Actは日付選択、ドロップダウンメニュー、ポップアップ対応などで90%以上の精度を目指しています。ウェブ操作能力を測定するScreenSpotやGroundUI Webといったベンチマークでも最高水準の結果を示しています。
この高い信頼性が実用面でもたらす価値は計り知れません。一度設定すれば後は見守る必要がなく、画面表示なしのヘッドレスモードで動作させたり、APIとして他のシステムに組み込んだり、定期的に自動実行したりできます。Amazonが例として挙げる「毎週火曜の夕食用サラダを自動注文するエージェント」は、日常的なタスク自動化の可能性を分かりやすく示しています。興味深いのは、Nova Actが想定外の環境でも力を発揮する点です。ビデオゲーム経験がないにもかかわらず、ウェブゲームの操作にも成功したという発見は、このAIがユーザーインターフェイスの理解を様々な状況に応用できることを示しています。すでにAlexa+のようなAmazonの実用サービスでもNova Actが活用されており、APIだけでは対応できないタスクをウェブ操作で補完しています。これはNova Actが単なる実験ではなく、実際のサービスを強化する技術として機能していることの証明です。
Amazonによれば、Nova Actは大きな開発計画の初期段階に過ぎないとのこと。本当に賢く信頼性の高いエージェントを実現するには、単純な教師付き学習だけでなく、様々な環境での強化学習が必要だと考えられています。この方向性は、Nova Actがさらに進化していくことを示唆しています。
開発者はnova.amazon.comからSDKの研究プレビューに参加できます。Amazonは「エージェントの最も価値あるユースケースはまだ見つかっていない」と述べており、開発者コミュニティとの協力を通じて新たな可能性を探求する姿勢を示しています。ここから生まれる新しいアイデアとアプリケーションが、私たちの生活やビジネスをどう変えていくのか、その可能性は計り知れません。

まとめ

いかがだったでしょうか?
Amazon Nova Actの登場は、AIが単に会話するだけでなく、実際にブラウザ上で行動できる時代の幕開けを感じさせます。高い信頼性と柔軟な構成能力を備えたこの技術は、私たちの日常やビジネスでの多くのタスクを自動化する可能性を秘めています。nova.amazon.comで提供されている研究プレビューを通じて、開発者たちがどのような新しいアプリケーションを生み出していくのか、今後の展開が楽しみです。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録