高額GPUなしで30倍速に!Lightrick社LTXV-13Bとは

Lightricks社が発表した新型AIビデオ生成モデル「LTXV-13B」は業界に新風を吹き込んでいます。従来比30倍の速さでビデオを生成し、特別な専門機器なしに一般向けパソコンで動作する点が注目を集めています。クリエイターが自分のマシンだけで高品質なAIビデオを作れる時代がついに到来したのです。

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

ハードウェア制約を克服する技術革新

参照:Lightricks

AIビデオ生成の世界では長らくハードウェアの壁が大きな課題でした。RunwayやPika、Lumaなどの主要サービスが提供するモデルは、80GB以上のVRAM(ビデオメモリ)を備えた企業向けGPUを必要としており、これは一般のクリエイターには手が届かない高価な機材でした。
LTXV-13Bモデルはこの状況を一変させます。Lightricks社のゼーブ・ファルブマン氏によれば、消費者向けGPUと企業向けGPUの最大の違いはVRAMの量にあり、NVIDIA GeForce RTX 3090や4090は24GBまで、最新の5090でも32GBのVRAMしか搭載していませんが、LTXV-13Bはこの制限内で動作するよう巧みに設計されています。
この技術的突破の中心にあるのが「マルチスケールレンダリング」と呼ばれる手法です。このアプローチではビデオ生成を粗いグリッドから始め、シーンの大まかな近似を作成した後、シーンを複数のタイルに分割して各タイルに徐々に詳細を追加していきます。まるでアーティストが絵を描く過程に似たこの方法によって、必要なVRAMの量はタイルサイズによって制限され、最終的な解像度には左右されなくなったのです。さらに、LTXV-13Bは圧縮率の高い潜在空間を採用しており、品質を落とさずにメモリ使用量を抑えることに成功しました。ファルブマン氏は「ビデオでは、潜在空間にいる間にVRAMを少なく使用できる高い圧縮率があります」と説明しています。
量子化や近似処理なしでも、LTXV-13Bは3090、4090、5090といった消費者向けGPU(ノートパソコン版を含む)で完全に動作します。これはハイエンドな機材を購入する余裕がないクリエイターやフリーランサーにとって、創作の可能性を大きく広げる朗報といえるでしょう。

業界への影響とビジネス戦略

Lightricks社のLTXV-13Bモデル公開は、そのオープンソース戦略も含めて業界に新たな動きをもたらしました。多くのAI企業が自社のモデルを閉じたAPIの後ろに隠す傾向がある中、同社はモデルをHugging FaceGitHubで完全公開するという異なる道を選んだのです。ファルブマン氏はこの決断について「1年前は物事は閉鎖的でしたが、今は少し開かれつつあります」と説明し、オープンソース化には研究開発コストの削減という明確な狙いがあると語ります。学術界の研究者がモデルを使用して論文を執筆することで、技術発展の方向性をより鮮明に把握できるようになるのです。
収益面では、年間収益1000万ドル未満の企業に対してLTXV-13Bの使用を無料としており、ファルブマン氏は「学術界は除外され、彼らはモデルでやりたいことを何でもできます」と述べています。一方で収益が1000万ドルを超える企業に対しては、ゲームエンジンが成功した開発者に課金するのと同様のライセンス契約を交渉する計画を明らかにしています。
Getty Images(世界最大の写真・イラスト素材プロバイダー)とShutterstock(オンラインの画像・動画素材サービス)との提携により、モデルトレーニング用のライセンスコンテンツも確保しました。ファルブマン氏は「AIモデルのトレーニングデータの収集はまだ法的にグレーな領域です」と認めつつも、「企業向けセグメントには、このような問題を気にする大きな顧客がいるので、彼らにクリーンなモデルを提供できることを確認する必要があります」と指摘しています。
実用面では、ファルブマン氏自身が認めるように、LTXV-13Bはまだハリウッド映画のレベルには達していませんが、アニメーション制作などの分野では既に実用的な価値を発揮しています。「高品質なアニメーションの制作コストを考えると、本当のクリエイティブな作業、キーフレームやストーリーについて考える人々は予算の小さな割合を占めています。しかし、キーフレーミングは大きなリソースを必要とします」というファルブマン氏の分析は、AIがこの労働集約的な部分を効率化できる大きな可能性を示唆しています。
将来について、ファルブマン氏は「音楽、音声、ビデオなどが統合されたマルチモーダルモデルが登場するでしょう。そうすれば、良いリップシンクを行うことなどが容易になります」と予測しています。これらの技術融合がもたらす創作プロセスの変革は、現在進行形で始まっています。すでにLTXV-13Bは同社の主力プラットフォームLTX Studioへの統合が完了し、クリエイターたちの手元でその真価を発揮し始めているのです。

まとめ

いかがだったでしょうか?
Lightricks社のLTXV-13Bモデルは、一般的なGPUでの高速AIビデオ生成を実現し、クリエイターの可能性を大きく広げています。オープンソース戦略と段階的な収益モデルによって、幅広い層での活用が期待されます。技術と戦略の両面で新たな道を切り開いた同社の取り組みは、AIビデオ制作の未来図を示す好例といえるでしょう。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録