Metaが発表、ロボットの触覚技術で人間らしい動きを実現へ

Metaが物理的な世界でロボットをより効果的に機能させるための新しいAIツール群を発表しました。人間の指に近い感覚を持つ触覚センサーの開発から、人間との協働を実現する技術まで、実用化に向けた具体的な成果が示されています。
本記事ではMetaのロボット技術に対する取り組みについて紹介していきますので、ぜひ最後までご覧ください!

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

触覚で世界を理解するSparshの可能性

Metaは、ワシントン大学とカーネギーメロン大学との共同研究により、ロボットの触覚認識を可能にする技術「Sparsh」を開発しました。このシステムは、視覚センサーを通じて得られた情報を触覚情報として解釈することで、物体を掴む際の適切な力加減といった繊細な判断を可能にします。
従来の触覚認識システムでは、特定のタスクごとに大量のデータを用意し、そのデータに基づいて学習を行う必要がありました。そのため、新しいタスクや異なる種類のセンサーに対応する際には、その都度データを集めて学習し直さなければならないという課題を抱えていました。この課題を解決するため、Sparshは自己教師あり学習(SSL)という手法を採用しています。SSLは人間が事前にデータにラベル付けをする必要がない学習方法で、46万枚以上の触覚画像を使用した学習により、従来のシステムと比較して平均95.1%の性能向上を達成しました。さらに、MetaのI-JEPAやDINOといった異なるアーキテクチャを基に様々なバージョンを開発することで、異なる種類の視覚ベースの触覚センサーにも対応できる汎用性を実現しています。しかし、優れた触覚認識システムを実現するには、高性能なハードウェアの開発も重要な課題となっています。
もしもロボットが視覚から情報を読み取り、触覚に反映することが可能となれば、人間が作業できないような危険な場所での精緻な作業もロボットに代替できると思われます!人型ロボットや火山や深海、宇宙を探究するような未来は、想像するだけでもワクワクしますね!

人工指が変えるロボットの未来

優れた触覚認識を実現するには、高性能なセンサーが不可欠です。Metaが新たに発表した人工指型の触覚センサー「Digit 360」は、この課題に応えるものとして注目を集めています。Metaが新たに発表した人工指型の触覚センサー「Digit 360」は、触覚認識技術の実用化に向けた重要な一歩となります。800万個以上のタクセル(触覚を感知する素子)を搭載したこのセンサーは、指先の表面で起こる微細な変形を全方向から検知することができます。またDigit 360の特徴的な点は、クラウドサーバーに依存せずにデータ処理ができることです。搭載されたAIモデルにより、人間の反射神経のように瞬時に触覚情報を処理し反応することが可能となり、研究者らは医療分野での精密な作業や仮想現実における触覚フィードバックなどでの活用に期待を寄せています。
この技術の実用化に向けて、Metaは触覚センサーメーカーのGelSight Inc.と製造提携を結び、さらに韓国のロボット企業Wonik Roboticsと協力して「Digit Plexus」プラットフォーム上での開発を進めています。Digit Plexusは、複数の指先や皮膚の触覚センサーを一つのロボットハンドに統合し、得られた触覚データを一本のケーブルでホストコンピュータに送信できる基盤技術として設計されています。このようなハードウェアの開発と並行して、Metaはロボットと人間のより自然な関わり方についても研究を進めています。
クラウドサーバーを経由すると、その分データ処理に多少の時間がかかるので、人間のような反応はできません。しかし、Digit 360はクラウドサーバーを介さないことで瞬時の反応を可能とできるようです。やっていることが日に日に人間に近づいてきていますね!

人間との協働を目指して

触覚技術の開発に加えて、Metaはロボットと人間の協働の実現に向けた新たなベンチマーク「PARTNR」(Planning And Reasoning Tasks in humaN-Robot collaboration)を発表しました。PARTNRは、家庭内での日常的なタスクにおいて、ロボットがどの程度人間の指示を理解し適切に行動できるかを評価するための基準です。Metaが開発したシミュレーション環境「Habitat」を基盤とするこのベンチマークでは、60軒の仮想的な家屋環境に5,800種類以上の物体を配置し、10万件の自然言語による指示に対するロボットの理解度と行動をテストすることができます。例えば、「キッチンの棚から青いコップを取って」といった日常的な指示を、ロボットがどのように解釈し実行に移せるかを評価します。
PARTNRは、大規模言語モデル(LLM)や視覚言語モデル(VLM)といった最新のAI技術を、実際の物理的なタスクにどう活用できるかを検証する場として期待されています。様々な研究機関や企業が開発する技術を、この共通の基準で客観的に評価できるようになることで、ロボット技術の実用化がより現実的なものとなってきています!

まとめ

いかがだったでしょうか?
Metaが発表した一連のAIツールは、ロボットに人間に近い触覚能力を与えることを目指しています。触覚情報を効率的に処理するSparsh、全方向からの感知が可能なDigit 360、そして人間との自然な協働を評価するPARTNRは、それぞれが異なる角度からこの課題にアプローチしており、これらの技術の組み合わせにより、ロボットの実用化に向けた開発が今後さらに進んでいくと予想されます。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録