【Stable Diffusion进阶教程】Midjourney 与 Stable Diffusion您应该选择哪一个?
Midjourney是一项网络服务,可使用文字制作令人惊叹的人工智能图片。它与稳定扩散类似,但也有一些区别。Midjourney只能在互联网上使用,并且需要付费。那么,中途值得付费吗?它与稳定扩散有何不同?让我们来看看吧。
Midjourney 与 Stable Diffusion – 功能比较
您将在本节中找到稳定扩散和中程之间的详细比较。与中途不同,稳定扩散有多种使用方法。我将限制我的分析使用AUTOMATIC1111,这是一种流行的稳定扩散 GUI。
与 Midjourney 一样,您可以使用 AUTOMATIC1111 作为网络服务(例如Google Colab)。您还可以在Windows PC和Mac上本地使用它。稳定扩散新手?查看快速入门指南。
您将在整篇文章中看到图像比较。我调整了每种情况下的提示和选择的模型以优化图像。所以它们并不是相同提示的直接比较,而更像是尝试生成各种风格的相似图片。

中途 (v4)

这是比较的摘要。
稳定扩散(AUTOMATIC1111) | 中途 | |
---|---|---|
图片定制 | 高的 | 低的 |
易于上手 | 低的 | 中等的 |
轻松生成优质图像 | 低的 | 高的 |
修复 | 是的 | 不 |
外画 | 是的 | 不 |
纵横比 | 是的 | 是的 |
型号变体 | ~1,000 秒 | 〜10秒 |
负面提示 | 是的 | 是的 |
一代人的变化 | 是的 | 是的 |
控制构图和姿势 | 是的 | 不 |
执照 | 宽容。 取决于所使用的型号 | 限制性的。 取决于付费等级 |
制作你自己的模型 | 是的 | 不 |
成本 | 自由的 | 每月 10-60 美元 |
模型 | 开源 | 所有权 |
内容过滤器 | 不 | 是的 |
风格 | 各不相同 | 写实插画,艺术 |
升级者 | 是的 | 是的 |
图片提示 | 不 | 是的 |
图像到图像 | 是的 | 不 |
提示字数限制 | 没有限制 | ? |
图片定制
在 Stable Diffusion 中有更多自定义图像的方法,例如更改图像大小、应遵循提示的程度、生成的图像数量、种子值、采样器等。Midjourney 中的选项较少。您可以更改宽高比、种子以及是否提前停止。
结论:Stable Diffusion获胜。
易于上手
AUTOMATIC1111安装起来有点困难。启动并运行后,您仍然需要查找并安装模型以获得您想要的样式。
Midjourney 并不像应有的那样用户友好,主要是因为他们选择使用 Discord 作为界面。但上手仍然容易十倍。
专业提示:想隐藏其他人的世代吗?创建一个新的私人服务器并邀请 Midjourney 机器人。并且您可以安心地生成图像。
结论:Midjourney 获胜。

中途 (v5)

稳定扩散 (DreamShaper)
轻松生成优质图像
Midjourney 因其非常容易生成具有大量精美细节的艺术图像而闻名。您不需要非常努力地工作来生成好的图像。事实上,很多时候,它会忽略你的部分提示并提供令人惊讶的美学图像。
稳定扩散用户需要投入更多的工作来构建良好的提示并尝试模型以生成类似质量的图像。
结论:Midjourney获胜。
迅速的
Stable Diffusion和Midjourney都支持提示和负面提示。两者都可以增加提示中任何关键字的权重。您可以使用 AUTOMATIC1111 执行更多提示技巧,例如混合两个关键字。
结论:平局。

中途 (v4)

型号品种
稳定扩散是一个开源模型。人们制作了不同风格的模型。目前有一千多个模型可供下载。每个模型都可以使用LoRA模型、嵌入模型和超网络进行进一步修改。最终的结果是模型的数量超出了你的时间去尝试。
Midjourney 的模型在比较方面是有限的。他们提供 v1 到 v5 模型,以及一些特殊模型,如 niji、test、testp 和 HD。还有一个附加参数可以“风格化”图像。但总体而言,Stable Diffusion的产品相形见绌。
结论:Stable Diffusion获胜。
图像编辑
您可以使用SD以多种方式编辑生成的图像。这包括通过修复仅重新生成图像的一部分,以及通过修复来扩展图像。您还可以使用instruct-pix2pix模型简单地告诉 Stable Diffusion 您想要更改什么。
遗憾的是,您无法使用 Midjourney 编辑图像。
结论:Stable Diffusion获胜。

中途 (v5)

风格
Midjourney v4默认生成具有逼真插图风格的图像。当提示正确时,它还可以生成其他艺术风格。v5 模型可以拍摄逼真的照片。
得益于热情的社区和易于训练新模型,Stable Diffusion可以生成更广泛的风格,从逼真的照片到抽象艺术。用户可以使用嵌入、LoRA 或超网络重新混合模型。它可以产生令人惊奇的效果并且玩起来很有趣。
结论:Stable Diffusion获胜。
一代人的差异
两种报价都会生成与生成的图像略有不同的内容。您可以在 Midjourney 中按图像下方的 V 按钮。您在 AUTOMATIC1111 中使用变分种子选项。
结论:平局。

输入图像

控制构图和姿势
您可以通过多种方式控制稳定扩散中的构图和姿势:图像到图像、深度到图像、instruct-pix2pix和controlNet。在 Midjourney 中,最接近的选项是使用图像提示,其作用类似于文本提示来控制图像生成。
结论:Stable Diffusion获胜。
成本
使用您自己的计算机可以免费使用 AUTOMATIC1111 的Stable Diffusion。相比之下,使用 Midjourney 每月至少要花费 10 美元。
结论:Stable Diffusion获胜。
执照
许多人没有意识到,您使用 Midjourney 生成的图像的所有权取决于您的付费等级。如果您不是付费订阅者,您将一无所有。如果你付出更多,你就有更多的权利。无论如何,Midjourney 都可以使用您的图像,而无需事先询问您。查看他们的服务条款。
相比之下,Stable Diffusion对您生成的图像不享有任何权利。您可以分发和进一步训练模型,甚至出售它。然而,其他人进一步微调的模型可能有额外的限制。因此,当您使用新型号时,请务必阅读许可和使用条款。
结论:Stable Diffusion获胜。

中途 (v4)

内容过滤器
最初的 Stable Diffusion v1 软件中有一个内容过滤器,但社区很快共享了一个禁用过滤器的版本。因此在实践中,v1 模型中没有内容过滤器。v2 比较棘手,因为 NSFW 内容已从训练图像中删除。它无法通过设计生成明确的内容。相比之下,在中途生成露骨图像是被禁止的。即使在提示级别它也会被阻止。如果你尝试的话,你可能会被禁止。
结论:Stable Diffusion获胜。
制作自己的模型
也许稳定扩散的最大吸引力是可以制作自己的模型。如果您不喜欢所看到的图像,您可以随时训练自己的模型。您可以使用dreambooth、textual inversion、LoRA、hypernetwork,或者只是使用您自己的图像进行额外轮次的训练。不幸的是,中途你无法做到这一点。
结论:Stable Diffusion获胜。
升级者
Stable Diffusion和中途都有升级器。AUTOMATIC1111 中可用的选择和参数更多。事实上,您可以轻松安装其他组件。
结论:Stable Diffusion获胜。
图片提示
您可以在 MidJourney 中将图像与文本提示一起用作提示。它将生成图像提示和文本提示内容的组合。这与Stable Diffusion中的图像到图像不同,其中输入图像充当初始图像,但不用于调节。Stable Diffusion 拥有的最接近的东西是Stable Diffusion Reimagine,它使用输入图像作为条件来代替文本提示。
结论:中途获胜。
图像到图像
目前,Midjourney 不提供图像到图像功能,这是一种扩散模型基于另一幅图像生成图像的方法。这并不奇怪,因为早期版本的 Midjourney 可能不是扩散模型。
结论:Stable Diffusion获胜。
提示限制
Midjourney 曾表示,其用户指南中的提示字数限制约为 60 个字。但他们删除了该声明。另一方面,AUTOMATIC1111 现在支持无限的提示长度。
结论:不清楚。
中途是否使用Stable Diffusion?
Midjourney v5 模型不是稳定扩散。他们就是这么说的。然而,v5 的改进看起来与 Stable Diffusion v2 非常相似:提示需要更加字面化和具体。人们得到了五个手指……Midjourney 能否分享 Stable Diffusion v2 的一些组件,例如OpenClip 文本嵌入?由于运行成本较低,使用扩散模型当然是有意义的。
中途比Stable Diffusion更好吗?
我不想给出一个外交答案,但这实际上取决于你想要什么。
《中途》有其独特的风格——高对比度、良好的照明和逼真的插图。创建具有大量细节的图像非常容易。您无需付出很大的努力即可获得良好的图像。
另一方面,稳定扩散也可以创建类似或更好的图像,但它需要更多的专业知识。因此,如果您愿意接受挑战并希望深入研究技术方面,那么稳定扩散非常适合您。
中途传播与Stable Diffusion有何不同?
您可以阅读第一部分进行逐点比较。主要区别在于运营模式和迎合的用户。
中途选择了专有的商业模式。他们负责模型开发、培训、调整和用户界面。一切都应该简单并且开箱即用。你告诉模型你想要什么,然后你就得到了。
Stable Diffusion 是一款拥抱开源生态系统的软件。该模型的代码和训练数据可供所有人访问。您可以在此基础上进行构建并微调模型以准确实现您想要的效果。你猜怎么着?人们已经这样做了!像您一样的用户已公开创建和共享了数千个模型。
但这还不是全部。每周都会有新的、令人惊叹的工具被创造出来,当人们有机会这样做时,他们的创造力总是让我感到惊讶。

中途 (v5)

在SD中生成中途图像
在SD中重新创建中途图像很棘手,但也是可能的。我使用以下工作流程。
使用相同的提示看看您会得到什么。您可以从 v1.5 基本模型开始。结果通常非常不同。 调整提示的关键字。您可能会发现 Midjourney 会忽略某些关键字并擅自添加其他关键字。我通常会查看提示生成器中的关键字,看看如何达到相同的效果。 您可能想要添加一个否定提示(通用的提示通常就可以)。 您肯定需要添加一些照明关键字。注意对比度和亮度。选择可以达到类似效果的照明关键字。 由于中途图像偏暗,您可能需要添加 LoRA,例如epi_noiseoffset。 最后,尝试不同的模型并调整调整提示。
如果您想复制合成,请使用ControlNet 。
我将写另一篇文章来逐步详细说明该过程。敬请关注!
我应该使用哪一个?
Midjourney 和 Stable Diffusion 都拥有庞大的用户群。他们有自己的优点和缺点。
中途旅行适合您,如果
您希望在没有深度学习曲线的情况下生成令人惊叹的图像。 您很忙,没有时间建立和学习模型。 你喜欢中途风格。 您正在寻找开箱即用的人工智能图像解决方案。 您不介意支付订阅费。 您同意他们的使用条款。
Stable Diffusion 适合您,如果
您想要一个完全免费的解决方案。 你想在本地运行一切。 你精通技术。 您喜欢修改设置、尝试模型组合以及使用新工具。 您需要图像编辑功能。 您更喜欢开源工具。 您想要更多地控制您的图像。
我希望这篇文章可以帮助您了解 Midjourney 和 Stable Diffusion 之间的区别,并帮助您决定使用哪一种。如果你有足够的时间和资源,你应该两者都尝试一下。您可能会发现两者在您的工作流程中都占有一席之地。我同时使用它们,并且常常对与另一个人一起制作图像的挑战着迷。