OpenAIのSORAに対抗!動画生成AI「Vidu」のクオリティを検証

中国からKlingAIに次ぐ新しい動画生成AIである「Vidu」が発表されました。
80クレジットを提供されるため、誰でも20個の動画は無料で作れます!
本記事ではViduの開発背景と技術的特徴、デモンストレーションと中国文化への適応、実際の検証について紹介していきますので、ぜひ最後までご覧ください!

ARCHETYP Staffingでは、多様なプロフェッショナル人材を募集しています。
ここでしか見つからない魅力的な企業の求人も多数取り揃え、あなたのスキルと経験を最大限に活かせるポジションをご提供します。
また、正社員から、高収入かつ働き方の自由度が高いプロジェクトベースの仕事や、よりプロフェッショナルとして働く契約社員へのキャリアチェンジを考えている方も大歓迎です。

ご自身の今後のキャリアについて相談したい方も、ぜひお気軽にお問い合わせください。
私たちが、あなたのキャリアの可能性を広げるお手伝いをいたします。

ボタンから募集中の求人一覧ページに移動できます。

Viduの開発背景と技術的特徴

Viduは、中国の技術企業Shengshu Technologyと清華大学の共同プロジェクトとして誕生し、開発チームは2022年9月に、U-ViT(Universal Vision Transformer)と呼ばれる核心技術を提案しました。この技術は、拡散モデル(最初はぼんやりとした画像から始まり、徐々に細部を詳細に描いていく方法)とトランスフォーマーモデル(文脈を理解するのに優れており、画像や動画では、各部分の関係性を示すモデル)の利点を組み合わせた視覚変換モデルアーキテクチャであり、開発チームはこれがOpenAIのSoraが採用しているDiT(Diversity in Transformation)モデルを超える技術だと主張しています。
Viduの特徴として、1回のクリックで最大16秒間の1080P動画を生成する能力が挙げられます。清華大学AI研究所の副所長である朱俊氏によると、Soraの発表が彼らの研究をさらに推進する動機となったとのことで、Viduは、Soraが世界的な注目を集めてから約2ヶ月後に登場しました。
ViduはSoraをベンチマークにして開発されたモデルのようです。Soraはまだ一般公開はされていないので、開発のスピード感は、Viduの方が早かったようですね!

Viduのデモンストレーションと中国文化への適応

北京で開催されたフォーラムでのライブデモンストレーションにおいて、Viduの能力が披露されました。このデモでは、物理法則に従った複雑な詳細描写を含むシーンの生成が示され、特に合理的な光と影の効果や繊細な表情のシミュレーション能力が注目を集めました。また、Viduの特筆すべき特徴として、中国文化への深い理解と適応能力が挙げられます。開発チームの報告によると、Viduは中国独自の文化的要素を反映した映像を生成でき、例えばパンダや龍といった中国を象徴するキャラクターのイメージ生成が可能だとしています。しかしながら、Viduに対する反応は現時点では完全に肯定的とは言えず、SNS上では「まだSoraに追いつくには無理」という意見も見られるなど、技術の完成度に関しては評価が分かれているようです。
Soraが一般公開されていない状況なので、一概にどちらが上かを評価することは難しいですが、現時点でのViduのクオリティを知ることはできるので、次セクションで筆者が動画を作成してクオリティを確かめていきたいと思います!

実際の生成動画

Viduは無料で80クレジットを提供しており、1回の動画生成を4クレジットで生成できるので、無料で20個の動画を生成することができます。またサブスクの契約をする場合の金額は以下になります。

無料版だと4秒の動画しか生成できませんが、Standard以降から8秒の動画も生成できるようになります。また、タスクの同時進行や商標利用が可能な点など、便利機能が多い印象です。現在時点では半額で登録ができるので、無料版で気になった方はぜひ試してみてください!筆者は無料版で確かめてみていと思います。

制作の仕方はとても簡単で、TOPのグローバルナビにある「Create Video」を選択し、ログインすることで画像の生成が可能になります。

ログインすると上記のような画像が出てきます。左側にテキストを入力する画面と、画像を入力する画面があると思いますが、これは「Text→Video」と「Image→Video」の両方が可能なことを示しています。今回は両方試してみます!

1.Text→Video

こちらも非常に簡単で、テキストを入力する欄に、求める画像のプロンプトを入力するだけです。今回は、「犬がオープンカーに乗って、マンハッタンの街をドライブする」というお題で生成してみました。ちなみに、これだと生成される動画のクオリティが心配なので、上記のお題のプロンプトをGPTで作ってみました。

プロンプト:
Create an video of a joyful dog riding in an open-top convertible car through the bustling streets of Manhattan. The dog is a golden retriever with its tongue out, ears flapping in the wind, and wearing stylish sunglasses. The convertible is a bright red classic car, adding a sense of fun and excitement to the scene. In the background, capture the iconic Manhattan skyline with skyscrapers, yellow taxis, and people walking on the sidewalks. The setting is a sunny day,

日本語訳:
マンハッタンの街をオープンカーでドライブする犬の動画を作成してください。犬はゴールデンレトリバーで、舌を出し、風になびく耳を持ち、スタイリッシュなサングラスをかけています。コンバーチブルは明るい赤のクラシックカーで、楽しくエキサイティングな雰囲気を演出します。背景には、マンハッタンのスカイライン、摩天楼、黄色いタクシー、歩道を歩く人々を捉えます。天気は晴れで、街の活気あふれる雰囲気を高めます。

このように、GPTを使えば詳細なプロンプトを作成してくれます。犬種まで指定してくれるので、よりイメージがつきますね!

上記のプロンプトを入力し、「Create 4 credits」を押すと動画が生成されます。完成した動画が以下になります。

ポイントは押さえていると感じます!要素を入れ込みましたが、ほとんどを反映しており、クオリティは高いと感じました。ただ、4秒では物足りないので、8秒は欲しいところですね!
続いては「Image→Video」です。

2.Image→Video

こちらも簡単で、参考とする画像を挿入してプロンプトを入力するだけで動画が生成されます。

プロンプは無しでも動画は生成されるため、今回はプロンプトなしで生成してみました。
完成した動画は以下になります!

挿入した動画はアート調だったのでどんな動画になるか不安でしたが、しっかりと動きが表現されていて、クオリティは悪くないと感じました。
また、試しにプロンプトで「歩いている女性がオープンカーに乗り込む」と入力してみました!(プロンプトは英語で)
結果は以下になります。

場面が変わり、オープンではないカーが登場しましたが、女性は乗り込むことなくどこかへ行ってしまいました(笑)これはなんとも微妙ですね、、
プロンプト次第ではさらなるクオリティも追求できそうです。いい作品ができればどこかの機会で紹介したいと思いますので、お楽しみに!

まとめ

いかがだったでしょうか?
Viduの登場は、動画生成AI分野における中国の技術力向上を示すものといえるでしょう。Soraに対抗する技術を持ち、中国文化要素への理解を特徴とするViduは、今後の発展が期待されます。現時点では評価が分かれていますが、筆者的には悪くないと感じました。無料で試せるので、ぜひ試してみてください!

Viduをご利用される方はこちら
参考記事:中国がSORAのライバル動画生成AI「Vidu」をリリース

ARCHETYP Staffingでは、様々な領域のプロフェッショナル人材を幅広く募集しています!

– 経営コンサルタント、事業コンサルタント
– テクノロジー活用に積極的な教育関係者(リスキリング指導者)
– UI/UXデザイナー、フロントエンド・バックエンドエンジニア、プロジェクトマネージャー
– マーケティング・PRプロフェッショナル、コンテンツクリエイター、ビジネスプロデューサー – AI・テクノロジー分野でのキャリアを模索するすべてのプロフェッショナル
– 正社員から登録型派遣社員へのキャリアチェンジを考えている方

自らの専門性を武器に、AIを活用しながら活躍したい方は、ぜひご登録ください。

ジョブ型の働き方を支援し、プロフェッショナルの活躍の場を広げるARCHETYP Staffing。
AI時代のキャリアを切り拓く仲間を心よりお待ちしています。

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録