Midjourney 入门实战指南

writingbeginner

# Midjourney入门实用指南

说实话，第一次尝试Midjourney时，我输入了"美丽风景"，结果得到四张模糊、色彩柔和的噩梦图片，活像有人把鲍勃·罗斯的画作放进微波炉加热过。我感觉被欺骗了。但经过几十个小时调整提示词、与Discord界面搏斗、耗尽免费试用额度后，我终于摸索出真正有效的方法。这份指南将帮你避开最初的挫败感。

## 痛点：Discord是最糟糕的部分

没人告诉你的是：Midjourney没有网页应用，你必须使用Discord。如果你只用Discord玩过游戏，那感觉就像被扔进一个混乱的公共聊天室，所有人都在对着同一个机器人喊话。你会看到"想象提示词：戴帽子的猫"每两秒滚动而过，你自己的提示词瞬间就被淹没了。

**我犯的第一个错误：** 试图在`#新手-1`频道生成图像。不到三分钟，我的提示词就跑到200条消息之外，找不到结果，瞬间慌了神。

**解决方案：** 使用私人Discord服务器。创建自己的服务器（免费，30秒搞定），然后把Midjourney机器人加进去。这样只有你能看到生成结果。具体操作如下：

1. 打开Discord，点击左侧边栏的加号图标创建新服务器

2. 命名为"Midjourney实验室"或其他名称

3. 前往Midjourney网站，点击"加入测试版"，授权机器人加入你的新服务器

4. 在任何频道输入`/imagine`，机器人只会回复你

不用再在混乱中翻找了。仅此一项就消除了我80%的初始挫败感。

## 基础：如何写出有效的提示词

Midjourney不是搜索引擎。输入"一张狗的照片"是得不到杰作的。模型需要具体、描述性的语言。这是我经过50多次失败提示词后总结的模板：

```

[主体] + [动作或场景] + [艺术风格] + [光线/氛围] + [技术参数]

```

**范例（好）：**

```

/imagine prompt: 一只毛茸茸的萨摩耶犬在金色时刻奔跑过薰衣草田，照片级真实，8k，锐利对焦，温暖阳光透过花瓣洒落，电影构图

```

**范例（差）：**

```

/imagine prompt: 田野里的狗

```

区别在哪？第一个给AI设定了限制：它知道品种、时间、光线和构图风格。第二个含糊不清，Midjourney只能用随机噪音填补空白。

**我吃过的教训：** 避免"情感""悲伤"这类抽象概念。Midjourney不懂感受。要描述悲伤的样子："一个人独坐昏暗房间，雨水打在窗户上，色调柔和，低头垂首。"

## 真正重要的参数

你会看到有人在提示词后加`--ar 16:9`或`--v 6`。以下是各参数的作用及使用时机：

- **`--ar`（宽高比）：** `--ar 16:9`适合横屏，`--ar 9:16`适合竖屏（手机壁纸），`--ar 1:1`适合正方形。我常用`--ar 3:2`做标准照片打印。

- **`--v`（版本）：** 始终用`--v 6`（截至2025年初的最新版）。版本5较旧，生成图像连贯性差。版本4基本无法处理人脸。

- **`--style raw`（原始风格）：** 移除Midjourney默认的"美化"滤镜。想要粗粝写实的图像（如纪录片照片）就加上它。不加的话，所有图像都像奇幻画作。

- **`--s`（风格化）：** 控制AI的"创意"程度。`--s 0`最写实，`--s 1000`最狂野。写实图像我保持在`--s 250`或更低，抽象艺术则用到`--s 750`。

**我在参数上犯的最大错误：** 连续几周忽略`--style raw`。每张"写实"图像看起来都像电影海报——过度戏剧化，光线假得不行。加上`--style raw`后立刻改观。

## 迭代循环：如何真正得到想要的效果

Midjourney会生成四张网格图。每张网格下方有U1-U4（放大）和V1-V4（变体）按钮。我的工作流程是：

1. 用初始提示词**生成四张图像**

2. **选中最佳那张**（V1-V4），点击对应的"V"按钮，以此为基础创建四个新变体

3. **重复步骤2**直到接近理想效果

4. 用"U"按钮**放大**最终图像，提升分辨率、增加细节

5. 使用**"缩小"**（带放大镜图标的按钮）扩展构图，适合将特写变成全景画面

**真实案例：** 我想要一张赛博朋克街头市场的照片。第一次生成的网格图一塌糊涂——模糊的霓虹灯牌、奇怪的面孔。我点击V2（第二张图，光线尚可），得到四个新变体，从中选中V3，然后放大。最终图像可用，但面孔仍扭曲。于是我用"面部修复"按钮（笑脸图标）专门重建面部。

## 面部问题（及解决方法）

Midjourney第六版处理面部比第五版好得多，但手部和眼睛仍有问题。我生成过七根手指的人，或眼睛像在融化的图像。

**我测试过的解决方法：**

- 在提示词中加入`--no deformed faces`（无畸形面孔）。虽不完美，但能降低出现频率。

- **生成特写镜头**而非全身照。全身照中的面孔太小，容易变形。

- 放大后使用**"面部修复"**。这需要额外GPU时间（使用独立模型），但对肖像照值得。

- **明确描述面部：** "对称面孔，清晰眼睛，自然皮肤纹理，无妆容"。越具体越好。

## 额度经济：别浪费钱

Midjourney不便宜。基础套餐（每月10美元）提供3.3小时GPU时间——听起来很多，但每次生成约需30秒，每月大约400张图像。

**我节省额度的技巧：**

- **绝不放大差图。** 放大消耗的额度与重新生成相同。只有构图满意时才放大。

- **慎用混合模式。** 混合模式（通过输入`/settings`并开启"混合"激活）允许中途编辑提示词，但每次变体都消耗额度。

- **批量实验。** 我会集中一次完成所有"乱试"（测试随机提示词），然后保存好的。不要生成一张等一会儿再生成另一张，既浪费时间又浪费额度。

## 你应该知道的真实缺陷

Midjourney功能强大，但我希望早些知道它的局限：

1. **文字是乱码。** 如果需要可读文字（如招牌或书封），请用其他工具。Midjourney生成的随机字母像字体但毫无意义。

2. **不擅长特定物体。** 试试生成"1967年福特野马谢尔比GT500"，你会得到比例奇怪、缺乏特征的肌肉车。具体型号需要描述形状而非名称。

3. **NSFW过滤很严格。** 无法生成任何涉及性内容的内容，连"浪漫"提示词都可能被拦截。过滤器也会误伤非色情内容（如医学图解、艺术裸体）。

4. **社区动态没用。** "探索"选项卡展示热门图像，但多数过度风格化且无法复现，忽略它。

## 你的第一个实操步骤

别读了。去Discord创建私人服务器，运行这个提示词：

```

/imagine prompt: 木桌上的一杯咖啡，左边窗户透进晨光，蒸汽升腾，浅景深，照片级真实，--ar 4:3 --style raw --v 6

```

生成它。看网格图。点击V2创建变体。然后放大你喜欢的那个。这就是三分钟的完整工作流程。完成这一步，你就掌握了核心循环。剩下的只是调整措辞。

最难的不是学习Midjourney——而是放弃"输入一句话就能得到杰作"的期待。你做不到。但用这个工作流程，你可以非常接近。