Google「Veo 2」「Imagen 3」、実例で見る高品質生成の実力!

Googleは2024年、動画生成AI「Veo 2」と画像生成AI「Imagen 3」の最新版を発表しました。VideoFX、ImageFX、新ツール「Whisk」を通じて、これらのAIモデルは一般に公開されています。すでに多くのクリエイターや企業が実際の制作現場での活用を始めています。

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

進化したVeo 2が実現する高品質な動画制作

Googleは2024年初め、最初の動画生成モデル「Veo」を発表しました。そしてこの度、その進化版となるVeo2が登場しました。Veo2の最大の特徴は、4K解像度での動画生成と分単位の長さに対応できる点にあります。これにより、短時間の動画だけでなく、より長めのコンテンツ制作にも対応できるようになりました。
映像表現の細かな制御も見逃せない特徴です。「18mmレンズ」や「浅い被写界深度」といった撮影技法をプロンプトに含めることで、意図した映像表現を実現できるようになりました。例えば、顕微鏡をのぞく科学者の表情を捉えたクローズアップや、ローアングルでのトラッキングショットなど、具体的な撮影手法を指定することが可能です。
安全性への配慮も充実しており、すべての生成動画には目には見えない「SynthID」という電子透かしが埋め込まれています。これにより、AI生成コンテンツであることを明示し、誤った情報の拡散や著作権の問題を未然に防ぐ仕組みが整えられています。
現在、Veo2はGoogle Labsの「VideoFX」を通じて段階的に公開されており、Vertex AI経由で企業の開発環境に組み込むことも可能となっています。Googleの発表によると、2025年にはYouTube Shortsなど他のサービスへの展開も予定されているとのことで、今後の活用の幅がさらに広がることが期待されます!

Imagen 3とWhiskによる新しい表現技法

動画生成の進化と並行して、画像生成の分野でも大きな進展が見られます。Imagen 3は、写実的な写真から印象派の絵画風、抽象画やアニメ調まで、幅広いアートスタイルの画像生成に対応しているのが特徴です。特に画像の明るさや構図、テクスチャの表現が向上し、より詳細な画像生成が可能になりました。さらに注目すべきは、Google Labsの新ツール「Whisk」の登場です。Whiskでは、ユーザーが持つ画像をもとに新しい画像を生成できます。その仕組みは、Googleの言語モデル「Gemini」とImagen 3を組み合わせたもので、Geminiが入力画像を分析して文章化し、その説明文をもとにImagen 3が新しい画像を生成します。この過程により、元の画像の要素を活かしながら、新しい表現やスタイルを探求することができます。
Imagen 3は現在、Google Labsの「ImageFX」を通じて100カ国以上で利用可能となっています。ビジネスシーンでは、商品プロトタイプのデザインやマーケティング素材の作成など、クリエイティブワークの初期段階での活用が見込まれます。
それでは、実際にVeo 2とImagen 3で生成された画像や動画の実例を見ていきましょう。これらの事例を通じて、皆様の業務における具体的な活用方法がイメージしやすくなるのではないでしょうか。

Veo2・Imagen3の実例紹介

ここからは、実際に公開されてりるVeo2とImagen3の実例を5つずつ紹介していきます!
まずはVeo2からです。こちらは利用するためには順番待ちの必要があるため、今回はXや公式で紹介されている動画を5つ紹介していきます。

Veo2

どの動画を見ても動きに違和感が少ないことからも、クオリティの高さが伺えますね。これは早く触ってみたくなります!
続いてはImagen3について紹介していきます。こちらはImageFXから利用可能なため、筆者が5つ作成してみました!

Imagen3

プロンプト:
Abstract, minimalist illustration of a bird in flight , dynamic composition , clean lines , vibrant color palette

プロンプト:
A futuristic fashion runway set in outer space, featuring a sleek glass-like catwalk floating among vibrant, glowing nebulae and distant stars. High-tech models in avant-garde space-inspired outfits, illuminated by soft, colorful lights. The audience consists of various alien species and robotic figures, with a dramatic cosmic backdrop. The atmosphere is ethereal, blending futuristic technology with a sense of infinite mystery.”

プロンプト:
Tokyo 1000 Years Later

プロンプト:
Lion yawning with mouth open, Realistic fur and mouth ,A portrait-like photo

プロンプト:
Recent emotional photos

上記の画像を見ていただくとお分かりの通り、現実に近い画像ほどクオリティが高いように感じました。筆者的には5枚目の複数の人物の表情画像が、リアリティがあってお気に入りです!
2025年はOpenAIやAnthropicなどのライバル企業を抑えて、GoogleがAIの覇権をとる可能性が見えてきましたね!

まとめ

いかがだったでしょうか?
Googleが提供するVeo 2とImagen 3は、動画と画像の生成において新たな可能性を広げています。特にビジネス現場では、アイデアの可視化やコンテンツ制作の効率化に役立つツールとして期待されています。現時点では一部のサービスでの提供となっていますが、今後はより多くのビジネスパーソンやクリエイターが活用できるようになるでしょう。まずはGoogle Labsで提供されているツールから試してみてはいかがでしょうか。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録