TikTokの親会社ByteDanceは、1枚の静止画から映画のワンシーンのような動画を生成できるAI「X-Portrait 2」を発表しました。このシステムは、恐怖や喜びといった感情表現を含む自然な表情の動きを生成できます。
本記事では、X-Portrait 2の仕組みと特徴、生成された表情、産業と社会への影響について紹介していきますので、ぜひ最後までご覧ください!
ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
ボタンから募集中の求人一覧ページに移動できます。
X-Portrait 2の仕組みと特徴
写真から動画を生成する技術は以前から存在していましたが、自然な表情の変化を表現することは大きな課題でした。従来のAIによる動画生成技術は、顔の特定のポイントを追跡して動きを作り出す手法が一般的でしたが、この方法では機械的な動きになりがちで、人間らしい自然な表情の変化を表現することが困難でした。
X-Portrait 2はこの課題を解決するため、顔の特定のポイントではなく顔全体の動きに着目した新しいアプローチを採用しています。表情筋の動きや目の細かな変化までを含めた学習により、急な感情の変化や会話中の表情変化など、より自然な動きの再現を可能にしました。この技術開発を支えているのが、ByteDanceならではの強みです。同社が運営するTikTokプラットフォームには、日々10億を超えるユーザーが様々な表情や感情を含んだ動画を投稿しており、この膨大なデータが学習素材として活用されています。多様な照明条件やカメラアングル、そして世界中の様々な人々の表情を学習することで、より自然な動きの再現を実現しています。
ByteDanceはこの技術をさらに発展させるため、グローバルな研究開発体制の構築を進めています。スイス、イギリス、フランスでの研究センター設立を検討しているほか、マレーシアでは21.3億ドル規模のAIセンター設立を計画し、清華大学との協力関係も深めています。こうした世界規模での開発体制は、エンターテインメント産業に新たな可能性をもたらそうとしています。
では、実際にどのように写真の表情が変化するのか、次セクションで見ていきましょう!
X-Portrait 2で生成された表情
どうやらまだ生成することはできないようなので、ByteDanceが公開している動画から生成物のクオリティを確かめてみましょう!
参照:ByteDance
左下が動かす元の写真であり、右下が表情の元となる動画です。実際に見ていただけると分かる通り、表情の一致具合が完璧ですね!他のAIツールだと口だけ動いたり、顔の皺までは動かないことが多いですが、X-Portrait 2では完璧に表情の変化を捉えていました。
他の人物でも比較してみます!
参照:ByteDance
こちらは男性の表情変化を表現した動画になります。元動画は哀愁の漂う表情が特徴的でしたが、X-Portrait 2によって哀愁も完璧に表現されていました。特に唇の動きや歯の見え方、目線の動きが詳細に捉えられていると筆者は感じます。この技術をアニメで再現すれば、2.5次元のアニメの再現も可能になってきそうですね!
最後は、他社製品と比較した動画を紹介していきます。
参照:ByteDance
いかがでしょうか。比較してみるとX-Portrait 2のクオリティの高さが際立って見えますね。X-Portraitは目線の動きが少しぎこちなく感じます。また、最近紹介したRunwayAct-Oneについては、キャラクターの表情変化をメインとしているため、一概に比較することは難しいですが、やはり目線の向きなどが不自然に見えてきます。皆さんはどの表情が好みでしょうか?気に入ったツールがあれば、ぜひ試してみてください!
RunwayAct-Oneの記事についても合わせてご覧ください:
スマホで広がる表情表現! Runway 「Act-One」の可能性
産業と社会への影響
映画やアニメーション制作の現場では、自然な表情の動きを作り出すために、高価な機材と多くのスタッフが必要とされてきました。しかしX-Portrait 2の登場により、一人の写真家と参照用の映像があれば、これまでのような大規模な制作設備を必要としない可能性が見えてきました。
すでにデモンストレーションでは、「シャイニング」「フェイス・オフ」「フェンス」といった映画の象徴的なシーンの表情演技を、元の人物の特徴を維持したまま見事に再現しています。この技術は、特に予算や設備に制限のある制作現場に新たな可能性を提供すると期待されています。
一方で、この技術の発展は新たな社会的課題も浮き彫りにしています。デジタルコンテンツの真偽を見分けることがより困難になる可能性があり、特に政治的な場面や報道での悪用を防ぐための対策が求められています。こうした課題に対し、ByteDanceはX-Portrait 2の実装コードを非公開とし、無許可での利用や誤解を招くコンテンツの作成を防ぐ方針を示しています。各国の規制当局による監視が強まる中、技術の安全性とプライバシーの保護を重視する姿勢を明確にしています。
今後は写真家の需要がますます高くなりそうですね。希望する人物の写真をプロに集めてもらい、X-Portrait 2で表情を動かすことにより、複雑なCGを使う必要もなくなります。今のうちにカメラを買っておいた方が良いかもしれません!
まとめ
いかがだったでしょうか?
ByteDanceが開発したX-Portrait 2は、従来の技術では難しかった自然な表情の動きを実現しました。エンターテインメント産業に新しい可能性をもたらす一方で、デジタルコンテンツの真偽性やプライバシーの保護といった新たな課題も見えてきています。ByteDanceは技術の発展と適切な管理のバランスを取りながら、開発を進めています。
ARCHETYP Staffingではクリエイターを募集しています!
私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!
ボタンから募集中の求人一覧ページに移動できます。