Dall-E 3 与 Midjourney:并排 AI 图像比较
已发表: 2023-10-26OpenAI 的 Dall-E 3 已经上市大约一个月了,各地的创意爱好者都在深入研究各种用例。 从创建人工智能图像到制作短片,潜力似乎是无限的。
现在您可能会问:Dall-E 3 真的值得大肆宣传吗? 比中途好吗?
如果您一直在使用 Midjourney 来满足 AI 图像需求,您可能想知道切换是否合适。
在这篇博文中,我们将深入进行深入比较,其中我们使用 16 个不同的提示将 Dall-E 3 与 Midjourney 进行比较,以了解每个平台的优点和缺点。
什么是 DALL-E 3 和 Midjourney?
DALL-E 3 是 OpenAI 最新的人工智能艺术生成器。
它内置于 ChatGPT 中,用户界面友好,可通过 ChatGPT Plus 获取,每月 20 美元。 虽然仍处于测试阶段,但它在精确图像的各个领域引起了轰动。
查看有关如何使用 Dall-E 3 的详细指南。
另一方面,我们有 Midjourney,Discord 中的一个机器人。
它以其丰富的风格和图像情感而闻名。 每月 10 美元,您可以从他们的基本计划开始,但有时要准备好调整您的提示。
因此,DALL-E 3 通过专用平台提供详细的艺术,而 Discord 中的 Midjourney 则倾向于创造力和情感。 两者都有各自的优点。 这一切都取决于您正在寻找什么。
Dall-E 3 与 Midjourney:比较矩阵
达尔-E 3 | 中途 | |
---|---|---|
使用方便 | 好简单 | 中等的 |
成本 | 每月 20 美元 | 每月 10 美元起 |
画面质量 | 更多细微差别和细节 | 好的 |
图像风格 | 支持所有艺术风格 | 支持所有艺术风格 |
图片大小 | 方形、高且宽 | 支持自定义尺寸 |
创造力 | 理解用户意图 | 调整创造力水平 |
图像生成速度 | 慢一点 | 几秒钟 |
AI图像版权 | 用户拥有他们创建的图像 | 用户拥有他们创建的图像 |
现实主义 | 不太栩栩如生,但更多细节 | 更现实 |
定制化 | 有限的定制选项 | 更多定制选项 |
Dall-E 3 vs Midjourney:终极对决
查看比较表可以给您一个简要的了解,但只有通过并排比较您才能了解每个人工智能艺术生成器的优点和缺点。
在本节中,我们精心挑选了一些最好的图像和艺术类型。 我们将在 Dall-E 3 和 Midjourney 中对每种类型使用相同的提示来比较结果。
注意:左边的所有图像都是在 DALL-E 3 中创建的,右边的所有图像都是由 Midjourney 创建的。
风景
提示:暴风雨天空下金色的麦田,孤独的稻草人戴着鲜红的围巾
Dall-E 3 图像具有细致、说明性的风格,带有温暖的金色色调,展示了稻草人般的人物。 相比之下,中途之旅的图像更具摄影感,聚焦于迫在眉睫的暴风雨中披着斗篷的人物,以棕褐色调绘制。 它完全错过了稻草人。
抽象概念
提示:使用充满活力的色彩和旋转图案来直观地表现笑声
Dall-E 3的画面有很多混合的颜色,看起来像在旋转,有很多蓝色,让人感觉很梦幻。 在《中途》的照片中,一位女士在笑,她周围有彩色图案,让笑声显得生动而真实。 两人都笑得很开心。
虽然《中途》做得很好,但图像看起来并不像抽象艺术。 Dall-E 3 理解了提示的意图并生成了抽象的视觉效果。
历史设定
提示:一名角斗士在罗马斗兽场准备战斗,调整头盔并握紧盾牌
左侧,Dall-E 3 展示了一位戴着精致华丽头盔的角斗士站在罗马斗兽场前。 气氛更加宁静,阳光照亮了他的装备。
右侧的中途图像呈现了一个在亲密时刻更加粗犷的角斗士。 这位战士似乎陷入了沉思,也许是在思考前方的战斗。 他的盔甲更加经过了战斗,场景感觉更加黑暗和激烈。 他紧紧握住华丽的盾牌,展现出他的决心。
两张图片看起来都很真实。 Dall-E 3 几乎包含了我们在提示中询问的所有内容,但中途错过了头盔和斗兽场。 Dall-E 3 还漏掉了“调整头盔”部分。
未来场景
提示:控制论街头音乐家在大都市霓虹灯照亮的小巷中演奏发光乐器
Dall-E 3 拍摄的左图展示了一条平静而长的小巷,里面有外星人般的音乐家和明亮的霓虹灯标志。 它也确保了背景的完美细节。 Midjourney 的正确图像让人感觉更加忙碌,人类和机器人混合在一起,还有一条更宽、充满活力的小巷,充满了霓虹灯的反射。 虽然这两张照片都展示了霓虹灯照亮的小巷中的未来派音乐家,但 Dall-E 的感觉更像是在另一个星球,而 Midjourney 的则混合了今天和未来的氛围。
肖像
提示:一位银发扎发髻、戴着复古眼镜、绣着彩色图案的老妇人
这两张照片精美地捕捉了一位正在刺绣的老妇人的画面。 左边的 Dall-E 3 图像显示了一位戴着引人注目的复古眼镜、银色头发扎成发髻的女人。 她正在研究一种充满活力的模式。 环境优雅,柔和的灯光凸显出她的特色。 Midjourney 的右图看起来更坦率,这位女士戴着更休闲的黑框眼镜,穿着一件彩色衬衫。
两张图片都强调刺绣艺术,但 Dall-E 3 偏向优雅,而 Midjourney 则给人舒适和真实的感觉。
像素艺术
提示:法师在像素化的魔法森林背景下使用魔法粒子和漂浮的法术书施展法术
左侧,Dall-E 3 提供了森林背景的像素化图像,法师穿着深蓝色斗篷,戴着高帽子,复制了老式电子游戏的氛围。 你可以看到魔法粒子在他周围旋转,还有漂浮的魔法书,它是敞开的,展示着发光的页面。
现在,在右侧,《中途》描绘了一幅更加真实的画面。 法师被描绘成一个年轻、神情紧张的男人,全神贯注于施法。 魔法粒子清晰可见,围绕着他手中的发光球状魔法书。 虽然森林背景很明显,但它并没有像提示所要求的那样像素化。
虽然这两张图片都出色地描绘了一位法师施展咒语,但只有 Dall-E 3 完美地呈现了“像素化”细节。
超现实主义艺术
提示:浮岛上一只超大蝴蝶正在向一圈细心的小象读书
两个图像都是使用相同的提示创建的,但描绘的场景却截然不同。 Dall-E 3 的图像充满活力且有趣,展示了一只大象头的蝴蝶在漂浮的陆地上向小象读书。
另一方面,《中途旅程》的形象有一种迷人的丛林感觉,有一个巨大的大象岛和许多做不同活动的小象。 但是,《中途之旅》的版本忽略了“超大蝴蝶”的核心元素。
平面设计
提示:一张极简主义明信片,通过东京塔、寿司卷和樱花树枝等标志性轮廓展示东京的精髓
这两幅图像都通过东京塔、寿司和樱花捕捉了东京的精髓。 Dall-E 3的版本充满活力,在明亮的背景下展示了详细的城市景观和寿司卷,樱花茂盛。
相比之下,《中途》则采用柔和的色调、简化的结构和较少的樱花,呈现出平静和简约的风格。
虽然这两个作品都包含了所需的元素,但 Dall-E 3 添加了额外的功能,例如河流和桥梁。 从质量角度来看,Dall-E 的图像细节更加丰富,而 Midjourney 的图像则优先考虑简单和开放空间。
3D渲染
提示:精致的 3D 渲染玉龙吊坠,红宝石眼睛,悬挂在天鹅绒背景下的精致银链上
Dall-E 的吊坠(左侧)的绿色与“翡翠”外观非常匹配,眼睛呈红宝石色,但银链似乎比预期的粗。 背景看起来像天鹅绒。
中途的吊坠(右侧)看起来不太像玉,更有金属感,但它的红宝石眼睛很突出。 这里的链条更加详细,背景是纯黑色的。 与提示相比,Dall-E 的图像与“玉石”和“天鹅绒背景”的细节更加吻合,而《中途旅程》则强调了“银链”方面。
数码插图
提示:数字插图显示一只顽皮的猫试图从碗里偷偷捞出一条鱼,而附近的一只鹦鹉则大声警告
两张照片都显示一只猫试图从碗里拿鱼,附近有一只鹦鹉。 Dall-E 3 左侧的图像中有一只灰色条纹的猫平静地接触水面,而鹦鹉只是在一旁观看。
在右边的中途照片中,猫看起来很惊讶,并且没有鹦鹉。 Dall-E的图片有更多的细节和纹理,使其看起来更加精致。 《中途旅程》的图像给人一种匆忙的感觉,并且有一个黑暗的环境,缺少元素。
油画
提示:一位严肃的水手拿着旧指南针陷入沉思,背景是汹涌的大海和暴风云
左边的图像由 Dall-E 3 制作,一位年长的水手看上去若有所思,身后是波涛汹涌的大海。 右边的一幅是《中途》的作品,描绘的是一位年轻的水手眺望着平静的大海。 两张图片都符合提示,但由于暴风雨的背景,Dall-E 的图片看起来更接近。 两者的图像质量都很好,但给人的感觉不同:一种感觉像是回顾过去的冒险,另一种感觉像是为新的冒险做好准备。
西洋镜
提示:微型嘉年华场景,有运转中的摩天轮、享用棉花糖的小游客,以及立体模型风格的小丑杂耍发光球体
两张图片都展示了带有摩天轮的微型嘉年华场景。 Dall-E 3 的左图展示了游客拿着棉花糖和小丑在玩发光球,这与提示非常吻合。 Midjourney 的正确图像具有夜间的感觉和更复杂的设计,但没有向游客展示棉花糖或杂耍小丑。 虽然这两个图像都具有良好的质量,但 Dall-E 的图像更接近提示的具体细节,而 Midjourney 的图像提供了独特的视角,但微小的访问者并不那么清晰。
建筑学
提示:一个异想天开的树屋图书馆,有螺旋楼梯、悬挂的灯笼和摆满书籍的阳台
Dall-E 3 的左图更加梦幻,有很多细节、灯笼和更大的树屋。 Midjourney 的正确图像感觉更接近现实生活,房间和灯笼更少。 两张照片都捕捉到了带有螺旋楼梯和图书阳台的“树屋图书馆”的想法。 他们都很好地遵循了提示。
然而,Dall-E 的照片带有绿色的光芒,给人一种更加梦幻的感觉,而 Midjourney 的照片似乎是在晚上拍摄的,感觉更舒适。
这两个图像都是高质量的,但它们之间的选择取决于您是否喜欢更神奇或更真实的外观。
室内设计
提示:一间波西米亚风格的卧室,配有吊床、墙上挂毯、马赛克镜子和天花板上悬挂的植物
两张图片都捕捉到了波西米亚卧室的感觉。 Dall-E 的图像(左侧)色彩缤纷,图案丰富,有吊床状的座椅、清晰的挂毯和许多悬挂的植物,但缺少马赛克镜子。
Midjourney 的图像(右侧)更轻、更宽敞,有植物和蕾丝挂毯,但它的床不是吊床式的,也没有可见的马赛克镜子。
虽然这两张图片都有波西米亚风元素和悬挂植物,但两者都完全符合提示,特别是关于马赛克镜子和确切的吊床描述。
高上下文提示
提示:文艺复兴时期的铁匠作坊,有精致的工具、发光的锻炉、复杂的盔甲部件和正在工作的工匠
左边的 Dall-E 作品有一名铁匠、整齐排列的工具和突出显示的盔甲。 中途右边的人多,工具分散,气氛热闹。 虽然两者都描绘了车间,但 Dall-E 的图像侧重于单个工匠和他的工具,而 Midjourney 的图像更像是与多名工人一起忙碌的一天。
低上下文提示
提示:月光下的舞蹈
两张图片都展示了“月光下的舞蹈”。 Dall-E 拍摄的左侧图像采用充满活力的蓝色调,在大月亮的映衬下呈现出舞者的剪影,而右侧 Midjourney 拍摄的图像则通过更微妙的月光提供了更近距离、更细致的观察舞者的轮廓。 Dall-E 注重环境和对比,而 Midjourney 则强调舞者的情感。 两者都捕捉了月光舞蹈的主题,但风格不同。
精彩绝伦:Midjourney vs Dall-E 3
在评估了 Dall-E 3 和 Midjourney 中的 16 张 AI 生成的图像后,很明显 Dall-E 3 在捕捉复杂细节方面表现出色。 该平台在解释提示意图以生成相关图像方面也超越了 Midjourney。 另一方面,《中途旅程》在制作看起来真实的视觉效果方面具有优势。 虽然 Dall-E 3 力求完美,但有时会产生不太自然的图像。
对于寻求 AI 视觉细节的企业来说,Dall-E 3 可能是更合适的选择。 您很快就可以通过 ChatGPT Plus 以及最好的 AI 图像生成器 Photosonic 访问它。 OpenAI 计划很快发布 Dall-E 3 API,使其成为 Photosonic 中的集成功能。
常见问题解答
1. Midjourney 比 DALL-E 3 更好吗?
这并不是说一个人比另一个人完全“更好”。 他们有不同的风格和能力。 DALL-E 3 与 ChatGPT Plus 集成,是您通过 GPT-4 获得的软件包的一部分。 另一方面,中途可能会提供不同的效果图。 这更多地取决于您的个人喜好和您正在寻找的风格。
2. DALL-E 3是免费的吗?
不,DALL-E 3 不是免费的。 它与 ChatGPT Plus 捆绑在一起,每月费用为 20 美元。 此订阅还允许您访问 GPT-4。
3. DALL-E 3 和 Midjourney 哪个更便宜?
严格看数字,Midjourney 的起价更便宜,为每月 10 美元。 DALL-E 3 附带 ChatGPT Plus,价格为 20 美元/月。 因此,如果预算是一个关键因素,中程可能是您更具成本效益的选择。