北京大学とKuaishou Technologyが開発!無料AI動画生成ツール「Pyramid Flow」

新たなAI動画生成モデル「Pyramid Flow」が登場し、注目を集めています。この完全オープンソースのモデルは、高品質な動画を迅速に生成する能力を持っています。
本記事では、Pyramid Flow の特徴と技術、AI動画生成業界の現状、Pyramid Flowの潜在的影響と今後の展望について紹介していきますので、ぜひ最後までご覧ください!

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

Pyramid Flow の特徴と技術

参照:Venture Beat

Pyramid Flowは、北京大学、北京郵電大学、そしてKuaishou Technology(Klingの開発元として知られる企業)の研究者たちによって共同開発されました。この協力体制により、学術研究と産業応用の知見が組み合わされています。
Pyramid Flowの核心となる技術は、「ピラミッド型フローマッチング」と呼ばれる新しい方法です。この技術では、AIが動画を生成する際に段階的なアプローチを取り、最初は低解像度の画像から始めて徐々に詳細を追加していきます。最終段階でのみフル解像度の動画を作成するため、計算リソースを効率的に使用できるのが特徴です。この手法により、Pyramid Flowは5秒間の384p動画を約56秒で生成できます。これは他のAI動画生成モデルと比較しても遜色のない速度であり、さらに最長10秒、768p解像度、24フレーム/秒の高品質な動画を生成する能力も持っています。
Pyramid Flowの大きな特徴は、完全にオープンソースであることです。ソースコードはGitHubで公開されており、誰でも無料でダウンロードし、使用することができます。また、商用利用も許可されているため、幅広い用途での活用が期待されています。トレーニングデータとして、LAION-5BやWebVid-10Mなどの大規模なオープンソースデータセットが使用されていますが、これらのデータセットには著作権や倫理的な問題が指摘されているものもあり、今後の課題となる可能性があります。
中国の動画生成AIで有名になったKling AIの開発元が関わっているため、Pyramid Flowの生成クオリティにも信頼が持てそうですね!上記の公開動画を見る限りでも、動きは滑らかでクオリティは高いと筆者は感じました。オープンソースという点も、今後のさらなる発展に期待が寄せられます!

AI動画生成業界の現状

AI動画生成技術は急速な発展を遂げており、現在、複数の企業や研究機関が独自のモデルを開発しています。代表的なものとしては、RunwayのGen-3 Alpha、LumaのDream Machine、Kuaishou TechnologyのKlingなどが挙げられます。これらの商用サービスは高品質な動画生成能力を持つ一方で、高額な利用料金が設定されていることが多く、個人のクリエイターや小規模な企業にとっては敷居が高いのが現状です。例えば、無制限生成プランの年間利用料が数万円から数十万円に及ぶケースもあります。
AI動画生成技術の利用に関しては、データセットの問題も大きな課題となっています。多くのモデルが大規模データセットを使用してトレーニングされていますが、これらのデータセットには著作権のある素材が含まれている可能性があり、一部のアーティストや権利者から訴訟を起こされるなど、法的な問題に発展するケースも出てきています。また、生成されたAI動画の著作権や利用規約に関しても議論が続いており、生成された動画の権利帰属や使用用途など、法的・倫理的な側面でのルール作りがまだ追いついていない状況です。
画像生成AIや動画生成AIと著作権問題は切っても切り離せない関係になっています。今後、AIと共生する社会を想定した際に、一早いルール作りが必要不可欠になると考えられます。

Pyramid Flowの潜在的影響と今後の展望

Pyramid Flowの登場は、AI動画生成技術の分野に大きな影響を与える可能性があります。オープンソースであることから、多くの開発者やクリエイターが自由にこの技術を活用し、改良することができるため、技術の普及と発展が加速する可能性があります。
特に映画産業への影響が注目されており、すでに一部の映画スタジオがAI動画生成技術の導入を検討しています。Pyramid Flowのようなオープンソースモデルは、独自のAI動画生成システムを構築したい映画会社にとって魅力的な選択肢となる可能性があり、教育分野やマーケティング、広告業界においても、Pyramid Flowの活用が期待されています。動画教材の作成や、SNS向けの広告動画、製品紹介動画の作成などに活用できる可能性がありますが、これらはまだ推測の段階です。
今後、Pyramid Flowの技術がさらに向上し、現在の商用サービスとの機能差を縮めていくかが注目されています。オープンソースコミュニティの協力により、カメラアングルの精密な制御や人物の動きの細かな調整など、現在難しいとされる機能の改善や新たな応用方法の開発が進むことが期待されています。Pyramid Flowを含むAI動画生成技術が、創造性を拡張するツールとして、どのように社会に受け入れられ、活用されていくかが今後の焦点となります!

まとめ

いかがだったでしょうか?
Pyramid Flowの登場は、AI動画生成技術の新たな可能性を示しています。オープンソースという特性を活かし、技術の普及と発展に貢献する可能性がある一方で、著作権や倫理的な問題など、解決すべき課題も残されています。今後、技術の進化と社会的な議論が並行して進むことで、AI動画生成技術がより広く、適切に活用される環境が整っていくことが期待されます。Pyramid Flowは、この分野の発展における重要な一歩となる可能性を秘めています。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録