
Midjourneyが最新バージョン「v7」をリリースしました。音声で指示を出せるプロンプト機能と素早く画像を生成するドラフトモードを搭載した新バージョンですが、ユーザーからの評価は賛否両論となっています。なぜ以前のバージョンと違って評価が分かれているのか、新機能と課題について詳しく見ていきましょう。
ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
ボタンから募集中の求人一覧ページに移動できます。
声で操るクリエイティブの未来 – 音声プロンプトとドラフトモードの革命
Midjourney v7の最大の特徴は、テキストを入力する代わりに話しかけるだけで画像を生成できる音声プロンプト機能です。これまでユーザーはテキストの入力や参考画像の添付によってモデルに指示を出していましたが、v7ではマイクに向かって話すだけで、AIが音声からテキストプロンプトを作成し、それに基づいて画像を生成してくれます。Venture Beatで音声から画像を作る方法が公開されていましたので、上記に記載します。
この音声プロンプト機能と絶妙に組み合わさるのが新しい「Draft Mode」です。このモードではMidjourney v6.1に比べて著しく早く、わずか30秒から1分程度で画像が生成され、「Enhance」や「Strong」ボタンをクリックするだけで、ドラフト画像を完全な品質で再レンダリングできます。この2つの機能の組み合わせにより、創作プロセスがこれまでになく直感的になりました。「もっと詳細に」「暗くして」「リアリスティックに」といった具体的な指示を音声で伝えるだけで、視覚的なフィードバックを見ながら素早く調整が可能になり、クリエイティブなフローを中断することなく創作を進められます。

Midjourney v7を使うには、まず上記画像のような「Personalize」機能を通過する必要があります。これは2024年6月にv6で導入された機能で、以前は任意でしたが、v7では必須となりました。

実際の使用手順はシンプルで、アルファウェブサイトから「Create」をクリックし、「P」ボタンでパーソナライゼーションモードをオン、「Draft Mode」ボタンをクリックしてマイクアイコンを有効にするだけです。
このプロセスにはまだ改善の余地があり、「リアルタイムAPI切断」などのエラーが発生することもありますが、ビジネスシーンでのプレゼン資料作成やフリーランスのデザイナーがクライアントの要望を視覚化するといった場面では、この高速なワークフローが創造性を解き放つ鍵となるでしょう。では、なぜそのような機能にもかかわらず、評価が分かれているのでしょうか?
期待と現実の狭間 – Midjourney v7が直面する課題

Midjourney v7の登場に対する評価は、これまでの新バージョンリリースと大きく異なっています。過去のアップデートが圧倒的な称賛を受けていたのに対し、v7への評価は明らかに賛否両論となっています。
この評価が分かれる中心にあるのは、画質とプロンプト遵守度の問題です。Magnific AIの創設者Javi Lopez氏はXで「v7が実際にはv7らしく感じないことが問題です。むしろv6.2のような感じです」と指摘し、ペンシルバニア大学ウォートンスクールの教授Ethan Mollick氏も「v6がすでに非常に優れていた」と述べています。David Shapiro氏も「v6からの同一のプロンプトはv7では悪化しています」との見解を示しています。
技術的な問題点としては、人間の手の描写やテキスト生成の精度がまだ改善されていない点が挙げられます。特にIdeogramやOpenAIのGPT-4o画像ジェネレーターがテキスト生成でより高い精度を示す中、Midjourney v7の性能は期待を下回ると感じるユーザーも少なくありません。アーティストのCaptainHaHaa氏は「手、テキストはまだ問題があり、crefなし、srefsはおかしくなっています」と指摘しています。これは以前のバージョンで利用できた「cref」(キャラクターリファレンス)や「sref」(スタイルリファレンス)機能が現在のv7では十分に機能していないことを意味します。
操作面では、Midjourney v7は「Turbo」と「Relax」という2つの操作モードでリリースされており、Turbo Modeは標準のv6ジョブの2倍のコスト、Draft Modeは半分のコストで利用できます。アップスケーリングやインペインティングなどの機能は現時点でv6モデルに依存しています。一方で、AIパワーユーザーのDreaming Tulpa氏は「より良い画像品質」で「超芸術的」だと評価し、AIアーティストのTatiana Tsiguleva氏も「品質の大幅な向上!」と称賛しています。この評価の分かれ目は、ユーザーの期待値や使用目的、比較基準によって生じていると考えられます。
未完成の傑作 – 今後のアップデートで変わるMidjourneyの未来

Midjourney社は現在のv7を「アルファ」リリースと位置づけ、今後2ヶ月間で1〜2週間ごとのアップデートを予定しています。最も期待される今後の追加機能は、v7に特化した新しいキャラクターとオブジェクトの参照システムで、現在のv6で使用されている「–cref」や「–sref」の後継となります。また、現在v6モデルに依存している編集機能も、将来的にはv7モデルに完全に移行する計画です。これらの機能がv7に統合されれば、ユーザーは一つのバージョンで全ての作業を完結でき、より一貫性のあるワークフローが実現するでしょう。
Midjourney社の開発アプローチで注目すべきは、コミュニティを積極的に巻き込む姿勢です。公共の共有スペースとフィードバックチャネルを通じてユーザーの声を集め、ロードマップランキングセッションを開催して機能の優先順位付けをユーザーと共に行う計画は、「ユーザーと共に創る」という理念を体現しています。Midjourneyはv7について「完全に新しいモデルであり、独自の強みと課題を持つ」と説明しています。この言葉は単なるバージョンアップではなく、根本的なアーキテクチャの変更を示唆しています。今後のアップデートでは、手の描写やテキスト生成の精度向上、プロンプト遵守度の改善が進むことで、音声プロンプトとDraft Modeの真価が発揮されるでしょう。
AI画像生成ツールを業務に活用している方々は、現段階ではv6とv7を目的に応じて使い分けることも一つの選択肢です。正確さと一貫性が求められる本番用の案件にはv6を、スピードと直感的な操作が重要なアイデア出しやラフ段階ではv7を活用するといった使い分けが効果的でしょう。
まとめ

いかがだったでしょうか?
Midjourney v7は音声プロンプトとDraft Modeという新機能で創作プロセスを変えようとしていますが、期待と現実のギャップも存在します。まだ「アルファ」段階であり、これから2ヶ月間の継続的なアップデートで進化していく予定です。完成形ではない現段階での評価は時期尚早かもしれません。今後の発展に期待しつつ、自分の用途に合わせて使い分けることが賢明でしょう。
ARCHETYP Staffingではクリエイターを募集しています!
私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!
ボタンから募集中の求人一覧ページに移動できます。