Midjourney入門：実践ガイド

正直に言います。初めてMidjourneyを使ったとき、「美しい風景」と入力して、ボブ・ロスの絵を電子レンジで溶かしたような、ぼやけたパステルカラーの悪夢のような画像が4つ返ってきました。騙された気分でした。しかし、何十時間もプロンプトを調整し、Discordのインターフェースと格闘し、無料トライアルのクレジットを使い果たした結果、本当に効果的な方法を学びました。このガイドで、最初のフラストレーションからあなたを救います。

最大の悩み：Discordが最悪

誰も教えてくれないこと：Midjourneyにはウェブアプリがありません。Discordを使う必要があります。そして、ゲーム以外でDiscordを使ったことがない人には、混沌とした公開チャットルームに放り込まれたように感じます。誰もが同じボットに向かって叫んでいるようなものです。「imagine prompt: 帽子をかぶった猫」というメッセージが2秒ごとに流れていき、自分のプロンプトはすぐに埋もれてしまいます。

私の最初の失敗： #newbies-1チャンネルで画像を生成しようとしました。3分も経たないうちに、私のプロンプトは200メッセージも上に流れていきました。結果が見つからず、パニックになりました。

解決策： プライベートなDiscordサーバーを使いましょう。自分だけのサーバーを作成し（無料、30秒で完了）、そこにMidjourneyボットを追加します。これで、自分の生成結果だけが見えるようになります。具体的な手順は以下の通りです：

Discordを開き、左側のサイドバーにあるプラスアイコンをクリックして新しいサーバーを作成します。
「Midjourney Lab」など適当な名前を付けます。
Midjourneyのウェブサイトにアクセスし、「Join the Beta」をクリックして、新しいサーバーにボットを認証します。
あとは任意のチャンネルで/imagineと入力すれば、ボットがあなただけに返信します。

混沌としたスクロールはもう必要ありません。これだけで、最初のフラストレーションの80%が解消されました。

基本：効果的なプロンプトの書き方

Midjourneyは検索エンジンではありません。「犬の写真」と入力して傑作を期待してはいけません。モデルには具体的で説明的な言語が必要です。50回以上の失敗プロンプトを経て開発したテンプレートがこちらです：

[被写体] + [動作または設定] + [アートスタイル] + [照明/ムード] + [技術的パラメータ]

良い例：

/imagine prompt: ラベンダー畑を走るふわふわのサモエド犬、ゴールデンアワー、フォトリアリスティック、8k、シャープフォーカス、花びらを通して差し込む暖かい日差し、シネマティックな構図

悪い例：

/imagine prompt: 野原の犬

違いは何でしょう？最初の例ではAIに制約を与えています。犬種、時間帯、照明、構図スタイルが明確です。2番目は曖昧なので、Midjourneyはランダムなノイズで隙間を埋めてしまいます。

苦い経験から学んだこと： 「感情」や「悲しみ」のような抽象的な概念は避けましょう。Midjourneyは感情を理解しません。代わりに、悲しみがどのように見えるかを説明します：「薄暗い部屋に一人座る人、窓に打ち付ける雨、落ち着いた色調、うつむいた頭」。

実際に重要なパラメータ

プロンプトに--ar 16:9や--v 6を追加している人を見かけるでしょう。それぞれの機能と使用タイミングは以下の通りです：

--ar（アスペクト比）： 横長なら--ar 16:9、縦長（スマホの壁紙に最適）なら--ar 9:16、正方形なら--ar 1:1。標準的な写真印刷には--ar 3:2を使用しています。
--v（バージョン）： 常に--v 6（2025年初頭時点の最新版）を使用しましょう。バージョン5は古く、一貫性の低い画像を生成します。バージョン4は顔の描写がほぼ使い物になりません。
--style raw： Midjourneyのデフォルトの「美化」フィルターを解除します。ドキュメンタリー写真のような、ざらついたリアルな画像が必要な場合に追加します。これがないと、すべてがファンタジー絵画のように見えます。
--s（スタイライズ）： AIの「創造性」を制御します。--s 0は文字通り、--s 1000は奔放になります。リアルな画像には--s 250以下に抑えています。抽象アートの場合は--s 750にします。

パラメータに関する最大の失敗： 数週間--style rawを無視していました。生成した「リアルな」画像はすべて、過度に劇的で偽物のような照明の映画ポスターのように見えました。--style rawを追加することで即座に改善されました。

反復ループ：本当に欲しいものを手に入れる方法

Midjourneyは4枚の画像のグリッドを表示します。各グリッドの下には、U1-U4（アップスケール）とV1-V4（バリエーション）のボタンがあります。私が使用するワークフローは以下の通りです：

初期プロンプトで4枚の画像を生成します。
最良のものを選び（V1-V4）、対応する「V」ボタンをクリックします。これにより、その画像に基づいた4つの新しいバリエーションが作成されます。
ステップ2を繰り返し、イメージに近いものが見つかるまで続けます。
最終画像をアップスケールするには「U」ボタンを使用します。解像度が向上し、ディテールが追加されます。
「ズームアウト」（虫眼鏡のボタン）を使用して構図を拡張します。クローズアップをフルシーンに変換するのに最適です。

実際の例： サイバーパンクのストリートマーケットの写真が欲しかったのです。最初のグリッドは散らかっていました—ぼやけたネオンサイン、奇妙な顔。V2（2番目の画像、照明はまずまず）をクリックし、4つの新しいバリエーションを取得、そこからV3を選び、アップスケールしました。最終的な画像は使えましたが、顔はまだ歪んでいました。そこで「顔修正」ボタン（笑顔のアイコン）を使って顔だけを再生成しました。

顔の問題（とその解決策）

Midjourneyバージョン6はバージョン5よりも顔の描写がはるかに優れていますが、手や目には依然として苦労します。7本指の人物や、溶けたような目の画像を生成したことがあります。

テスト済みの回避策：

プロンプトに--no deformed facesを追加します。完璧ではありませんが、頻度は減ります。
全身ショットではなくクローズアップを生成します。全身画像の顔は小さく、歪みが生じます。
アップスケール後に**「顔修正」**を使用します。追加のGPU時間がかかりますが（別のモデルを使用）、ポートレートには価値があります。
顔を明示的に記述： 「左右対称の顔、はっきりした目、自然な肌の質感、ノーメイク」。具体的であればあるほど良い結果が得られます。

クレジット経済：お金を無駄にしない方法

Midjourneyは決して安くありません。基本プラン（月額10ドル）では3.3時間のGPU時間が与えられますが、各生成に約30秒かかることを考えると、それほど多くはありません。月に約400枚の画像です。

クレジットを節約する方法：

悪い画像は絶対にアップスケールしない。 アップスケールは新しい生成と同じくらいのコストがかかります。構図に満足した時だけアップスケールしましょう。
リミックスモードは控えめに。 リミックスモード（/settingsと入力して「Remix」をトグル）は、生成途中でプロンプトを編集できますが、バリエーションごとにクレジットを消費します。
実験はまとめて行う。 「スパム」（ランダムなプロンプトの試行）はすべて1回のセッションで行い、良いものだけを保存します。1枚生成して待ち、また1枚生成する、というのはやめましょう。時間とクレジットの無駄です。

知っておくべき実際の欠点

Midjourneyは強力ですが、もっと早く知っておきたかった制限があります：

テキストは意味不明。 読みやすいテキスト（看板や本の表紙など）を含む画像が必要な場合は、別のツールを使いましょう。Midjourneyはフォントのように見えるが意味のないランダムな文字を生成します。
特定のオブジェクトが苦手。 「1967年型フォード・マスタング・シェルビーGT500」を生成しようとすると、プロポーションの奇妙な一般的なマッスルカーが返ってきます。特定のモデルには、名前ではなく形状を説明する必要があります。
NSFWフィルターが強力。 性的なコンテンツは一切生成できず、「ロマンチック」なプロンプトでもブロックされる可能性があります。フィルターは医療図や芸術的なヌードなど、性的でないコンテンツも捕捉します。
コミュニティフィードは役に立たない。 「探索」タブには人気画像が表示されますが、ほとんどが過度にスタイライズされており、再現性がありません。無視しましょう。

最初の実践ステップ

読むのをやめてください。Discordに行き、プライベートサーバーを作成し、以下のプロンプトを実行してください：

/imagine prompt: 木製のテーブルの上のコーヒーカップ、左側の窓からの朝の光、立ち上る湯気、浅い被写界深度、フォトリアリスティック、--ar 4:3 --style raw --v 6

生成します。グリッドを確認します。V2（2番目の画像）をクリックしてバリエーションを作成します。そして気に入ったものをアップスケールします。たった3分でワークフロー全体が完了します。これができれば、核となるループをマスターしたことになります。あとは言葉を微調整するだけです。

最も難しいのはMidjourneyを学ぶことではなく、文を入力するだけで傑作が得られるという期待を捨てることです。そんなことはできません。しかし、このワークフローを使えば、それに近づくことができます。

Midjourney 入門実践ガイド