Midjourney:真实用户的诚实概述
我从2023年初开始使用Midjourney,当需要一些库存照片或快速草图无法提供的特定图像时,它已成为我的首选工具。它并不完美——远非如此——但作为自由撰稿人和概念艺术家,它是我发现的最稳定实用的AI图像生成器。以下是我认为它真正擅长的、不足之处,以及是否值得你花钱。
优势
Midjourney擅长生成视觉震撼、高分辨率且具有独特美学的图像。默认风格偏向绘画感、戏剧性和些许超现实主义——想象一下奇幻景观、电影感肖像或氛围感室内场景。例如,最近我为客户的书籍封面需要一张“带有生物发光苔藓的破败维多利亚图书馆”图像。Midjourney在一分钟内提供了四个不错选项,每个都有精细纹理、真实光照和协调配色。苔藓微微发光,书架隐入阴影,整体构图很有意图。
另一个优势是处理抽象或概念性提示的能力。我曾生成过“融化成星星水坑的时钟”和“由玻璃和烟雾构成的城市”——两者都出奇地连贯。该工具对空间关系的理解优于许多竞品;除非提示明确要求,物体通常不会相互融合。
快速遇到的限制
最大的挫败感是缺乏精确控制。你无法绘制粗略布局然后说“把树放在这里,人放在那里”。提示只能是文本,所以你只能依赖模型的解读。想要“红色汽车”是特定深红色?祝你好运——你很可能得到泛泛的红色,可能偏橙或偏栗色。你可以通过变体迭代,但这像猜谜游戏。
面部和手部仍不可靠。2024年初,Midjourney有了显著改进,但我仍会遇到六指的手或不对齐的眼睛。对于特写肖像,我通常需要生成10-20张图像才能得到一张无明显畸变的。此外,该工具在文字处理上很吃力——如果你要求一个写着“OPEN”的标牌,它很可能生成乱码或拼写错误。
关键工作流
标准工作流是:加入Midjourney Discord服务器(或使用2024年底推出的网页应用),输入/imagine加提示,等待30-60秒获取四张图像。然后可以放大一张、创建变体,或使用“remix”调整提示。对于复杂项目,我采用多步骤流程:
- 初始生成:宽泛提示获取氛围。
- 微调(细微):轻微调整最佳图像以修复细节。
- 放大:将分辨率提升至1024x1024或更高(付费计划支持2倍放大)。
- 修补(通过外部工具如Photoshop):手动修复手部、文字或不想要的元素,因为Midjourney自身的修补功能较弱。
对于批量工作,我使用“快速”模式并行运行多个提示(基础计划需额外付费)。我还使用“风格参考”功能模仿特定艺术家的风格——比如“爱德华·霍珀风格”以获得氛围感现实主义。
定价实情
Midjourney仅付费使用,基础计划每月10美元起,提供每月3.3小时GPU时间(约200-300次图像生成)。标准计划(每月30美元)提供15小时和无限“放松”模式(较慢,无GPU限制)。专业计划(每月60美元)包括30小时和隐身模式(你的图像不会在画廊中可见)。
关键在于:“快速”模式会快速消耗时间。每次生成约消耗0.5-1分钟GPU时间,但放大和变体也会累积。如果你每天生成50张图像,基础计划一周内就会用完。我使用标准计划,对于我的兼职使用来说足够了。此外,你可以暂停和恢复计费,这在你仅需要用于某个项目时很有帮助。
适合人群