FLUX.2登場 !画像生成AIがついに実務レベルに到達

「この画像、AIで作ったんだ」と言われて驚く時代は終わりました。Black Forest LabsがリリースしたFLUX.2は、画像生成AIを「すごい」から「使える」へと変えたツールです。実際の仕事で使えるレベルに到達した画像生成AI。何が変わったのでしょうか。

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

「使えない」を「使える」に変えた進化

参照:Black Forest Labs

画像生成AIを試したことがある方なら、こんな経験があるかもしれません。同じキャラクターを何枚か作りたいのに、生成するたびに顔が変わってしまう。細かい文字を入れたいのに、読めない記号の羅列になる。こうした「使えない」ポイントが、画像生成AIを仕事の道具として採用する上での障壁でした。FLUX.2は、この障壁を取り除くことに焦点を当てています。最も大きな変化は、最大10枚の参照画像を同時に使用できるようになった点です。企業のマスコットキャラクターで複数のバリエーションを作りたい場合、従来は生成するたびに顔つきが変わってしまいましたが、FLUX.2では同じキャラクターを維持したまま異なるポーズや構図の画像を生成できます。
テキストのレンダリングも改善されました。インフォグラフィックやUIモックアップを作る際、従来は文字が潰れて読めませんでしたが、FLUX.2は複雑なタイポグラフィを正確に再現できます。プレゼン資料のビジュアル案を作る際、文字を後から手作業で入れ直す必要がなくなります。
解像度も最大400万画素に対応し、一般的なフルHD画像の2倍の情報量を扱えます。製品撮影や印刷物用の画像を生成する際、この差は品質に直結します。プロンプトへの遵守性も向上し、複雑な指示でも指示通りの画像が生成されやすくなりました。照明や空間の論理性も改善されており、物理的にありえない影の落ち方や奥行きのおかしい構図が減っています。
技術的には、Mistral-3 24Bパラメータビジョン言語モデルと整流フロートランスフォーマーを組み合わせた潜在フローマッチングアーキテクチャに基づいています。ビジョン言語モデルが実世界の知識をもたらし、トランスフォーマーが空間関係や材質特性を捉えることで、以前は難しかった表現が可能になりました。前世代のFLUX.1が可能性を示したとすれば、FLUX.2は精度、効率性、制御性を高めることで制作ワークフローを変える段階に到達しています。
では、このFLUX.2をどう使えるのでしょうか。

使い方で選べる4つのモデル

FLUX.2の特徴は、自分の使い方に合わせてモデルを選べる点にあります。「とにかくすぐ使いたい」のか、「自分のパソコンで動かしたい」のか、目的によって最適な選択肢が用意されています。
すぐに使い始めたいなら、FLUX.2 [pro]またはFLUX.2 [flex]です。これらはAPIとして提供されており、BFL PlaygroundやBFL API経由で利用できます。[pro]は最高品質と速度を両立したモデルで、高品質な画像を素早く生成したい場合に適しています。[flex]は品質と速度のバランスを自分で調整できるモデルで、ステップ数(画像生成の計算を何回繰り返すか)を変えることで、時間をかけて細部まで作り込むか、速度を優先するかを選べます。
一方、自分のパソコンで動かしたい、あるいはコストを抑えたい方にはFLUX.2 [dev]があります。これは320億パラメータ(モデルが学習した知識の量を示す数値)を持つオープンウェイトモデルで、モデルの中身がHugging Faceで公開されています。データをダウンロードして自分の環境で動かすことができます。
FLUX.2 [dev]は、現在公開されているオープンウェイトの画像生成モデルの中では最も強力とされており、テキストから画像を作る機能と、複数の画像を参考にして編集する機能を1つのモデルで実行できます。GeForce RTX GPUのような一般的なグラフィックカードでも、NVIDIAとComfyUIが提供する最適化版を使えば動作します。自分で環境を作るのが難しい場合は、FALやReplicateといったプラットフォームで利用することもできます。ただし、商用利用する場合は別途ライセンスが必要です。
近日公開予定のFLUX.2 [klein]は、Apache 2.0ライセンス(商用利用を含めて自由に使えるオープンソースライセンス)で提供される予定です。FLUX.2の機能を引き継ぎながらサイズを小さくしたモデルで、同じサイズで一から訓練されたモデルより性能が高いとされています。
選び方はシンプルです。手軽さと品質を重視するなら[pro]か[flex]、自分の環境で動かしたい、コストを抑えたい、モデルの内部を検証したいなら[dev]を選びます。Black Forest Labsは「オープンコア」と呼ぶ方針で、誰でも検証できるオープンモデルと、企業が安心して使える商用モデルの両方を提供しています。
FLUX.2は、画像生成AIに「選ぶ自由」をもたらしたといえるでしょう。

まとめ

いかがだったでしょうか?
FLUX.2は、画像生成AIを「デモ」から「実務」へと引き上げました。複数の参照画像による一貫性、正確なテキストレンダリング、高解像度対応、そして用途に応じた製品ラインナップ。これらは制作現場が本当に求めていた機能です。画像生成AIが、ようやく仕事の道具として使える段階に入ったといえるでしょう。

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録