Dall-E 3 vs Midjourney: 나란히 있는 AI 이미지 비교
게시 됨: 2023-10-26OpenAI의 Dall-E 3가 출시된 지 약 한 달이 되었으며, 전 세계의 창의적인 애호가들이 다양한 사용 사례에 뛰어들고 있습니다. AI 이미지 제작부터 단편영화 제작까지 잠재력은 무궁무진해 보인다.
AI로 얼마나 빨리 영화를 만들 수 있는지 알아보는 10분짜리 실험입니다.
— 올리버 맥캔(@OliverZMcCann) 2023년 10월 14일
#ChatGPT에 스토리를 요청한 다음 #DALLE3으로 이미지를 생성해 달라고 요청했습니다.
#runwayml을 통해 이미지를 실행하고 음악을 추가했습니다.
GPT4가 생각해낸 이야기는 다음과 같습니다.
과거의 메아리:
소개: 재즈 바에서… pic.twitter.com/6hlPknBYY7
이제 여러분은 다음과 같은 질문을 하실 수도 있습니다. Dall-E 3가 정말 과대광고할 가치가 있나요? 미드저니보다 나은가요?
AI 이미지 요구 사항에 Midjourney를 사용해 왔다면 스위치가 올바른지 궁금할 수 있습니다.
이 블로그 게시물에서는 각 플랫폼의 장점과 단점을 이해하기 위해 16개의 고유한 프롬프트를 사용하여 Dall-E 3와 Midjourney를 비교하는 심층적인 비교를 살펴보겠습니다.
DALL-E 3와 Midjourney는 무엇인가요?

DALL-E 3는 OpenAI의 최신 AI 아트 생성기입니다.
ChatGPT에 내장되어 있어 사용자 친화적이며 ChatGPT Plus를 통해 한 달에 20달러에 이용할 수 있습니다. 아직 베타 버전이지만 정밀한 이미지를 위해 다양한 분야에서 파장을 일으키고 있습니다.
Dall-E 3 사용 방법에 대한 자세한 가이드를 확인하세요.

반면에 Discord 내부에는 Midjourney라는 봇이 있습니다.
이미지의 풍부한 스타일과 감정으로 유명합니다. 한 달에 10달러로 기본 계획으로 시작할 수 있지만 때로는 프롬프트를 조정할 준비도 되어 있어야 합니다.
그래서 DALL-E 3는 전용 플랫폼을 통해 디테일한 아트를 제공하는 반면, Discord 내 Midjourney는 창의성과 감성에 기댄다. 둘 다 나름의 장점이 있습니다. 그것은 모두 당신이 찾고 있는 것에 달려 있습니다.
Dall-E 3 대 Midjourney: 비교 매트릭스
달-E 3 | 중간 여정 | |
---|---|---|
사용의 용이성 | 아주 쉽게 | 중간 |
비용 | 월 $20 | 월 10달러부터 시작 |
이미지 품질 | 더 많은 뉘앙스와 디테일 | 좋은 |
이미지 스타일 | 모든 아트 스타일을 지원합니다. | 모든 아트 스타일을 지원합니다. |
이미지 크기 | 정사각형, 키가 크고 넓음 | 사용자 정의 크기 지원 |
창의성 | 사용자 의도를 이해합니다. | 창의성 수준 조정 |
이미지 생성 속도 | 조금 더 느리게 | 몇 초 |
AI 이미지 저작권 | 사용자는 자신이 만든 이미지를 소유합니다. | 사용자는 자신이 만든 이미지를 소유합니다. |
실재론 | 덜 생생하지만 더 자세하게 | 더욱 현실감 있게 |
맞춤화 | 제한된 사용자 정의 옵션 | 더 많은 사용자 정의 옵션 |
Dall-E 3 대 Midjourney: 궁극적인 대결
비교표를 보면 간략한 아이디어를 얻을 수 있지만, 나란히 비교해야만 각 AI 아트 생성기의 강점과 약점을 이해할 수 있습니다.
이 섹션에서는 최고의 이미지와 예술 유형을 직접 선택했습니다. 결과를 비교하기 위해 각 유형에 대해 Dall-E 3 및 Midjourney에서 동일한 프롬프트를 사용합니다.
참고: 왼쪽의 모든 이미지는 DALL-E 3에서 생성되었으며 오른쪽의 이미지는 Midjourney에서 생성되었습니다.
풍경
프롬프트: 폭풍우가 치는 하늘 아래 황금빛 밀밭, 밝은 빨간색 스카프를 두른 외로운 허수아비

Dall-E 3 이미지는 따뜻한 황금색 색조의 디테일하고 일러스트 스타일로 허수아비 같은 모습을 보여줍니다. 대조적으로 Midjourney의 이미지는 세피아 톤으로 칠해진 어렴풋한 폭풍 속에서 망토를 입은 인물에 초점을 맞춰 좀 더 사진적인 느낌을 줍니다. 허수아비를 완전히 놓쳤습니다.
추상적 개념
프롬프트: 생동감 넘치는 색상과 소용돌이 패턴을 사용하여 웃음 소리를 시각적으로 표현합니다.

Dall-E 3 사진은 다양한 색상이 혼합되어 마치 회전하는 듯한 느낌을 주고 파란색이 많이 들어가 몽환적인 느낌을 줍니다. 미드저니(Midjourney) 사진에는 다채로운 패턴으로 웃고 있는 여성이 있어 웃음이 생생하고 현실감 있게 느껴집니다. 두 사람 모두 웃음의 즐거움을 쿨하게 보여주고 있다.
Midjourney는 훌륭한 작업을 수행했지만 이미지는 추상 미술처럼 보이지 않습니다. Dall-E 3는 프롬프트의 의도를 이해하고 추상적인 시각 효과를 생성했습니다.
역사적 설정
프롬프트: 투구를 조정하고 방패를 쥐고 로마 콜로세움에서 전투를 준비하는 검투사

왼쪽에는 Dall-E 3의 세밀하고 화려한 헬멧을 쓴 검투사가 콜로세움 앞에 서 있는 모습이 나와 있습니다. 분위기는 더욱 고요해지고 햇빛이 그의 장비를 비춥니다.
오른쪽의 Midjourney 이미지는 친밀한 순간에 더욱 강인한 검투사의 모습을 보여줍니다. 이 전사는 생각에 잠겨 있는 것 같습니다. 아마도 앞으로 벌어질 전투에 대해 생각하고 있는 것 같습니다. 그의 갑옷은 전투에 더욱 낡아 보였고 장면은 더욱 어둡고 강렬하게 느껴졌습니다. 그는 화려한 방패를 꽉 쥐며 그의 결단력을 보여줍니다.
두 이미지 모두 실제처럼 보입니다. Dall-E 3에는 우리가 프롬프트에서 요청한 거의 모든 것이 포함되어 있었지만 Midjourney는 헬멧과 콜로세움을 놓쳤습니다. Dall-E 3도 ' 헬멧 조정 ' 부분을 놓쳤습니다.
미래의 장면
프롬프트: 대도시의 네온 불빛 골목에서 발광 악기를 연주하는 사이버네틱 거리 음악가들

Dall-E 3의 왼쪽 이미지는 외계인 같은 음악가와 밝은 네온사인이 있는 조용하고 긴 골목을 보여줍니다. 배경에 대한 완벽한 디테일도 확보했습니다. Midjourney가 촬영한 오른쪽 이미지는 인간과 로봇이 혼합되어 있고 네온 불빛이 반사되어 더 넓고 생기 넘치는 골목으로 가득 차 있어 더욱 분주한 느낌을 줍니다. 두 사진 모두 네온 조명이 켜진 골목에 있는 미래 지향적인 음악가들을 보여주는 반면, Dall-E는 다른 행성에 있는 것 같은 느낌을 주고 Midjourney는 현재와 미래의 분위기가 혼합되어 있습니다.
초상화
프롬프트: 은발을 롤빵으로 묶은 나이든 여성, 빈티지 안경을 쓰고 화려한 문양을 수놓은 모습

이 두 이미지에는 자수 작업을 하고 있는 나이든 여성의 모습이 아름답게 담겨 있습니다. 왼쪽의 Dall-E 3 이미지는 눈에 띄는 빈티지 안경을 쓰고 은발을 롤빵으로 묶은 여성을 보여줍니다. 그녀는 역동적인 패턴으로 작업하고 있습니다. 은은한 조명이 그녀의 특징을 돋보이게 하여 분위기가 세련되었습니다. Midjourney의 오른쪽 이미지는 좀 더 솔직해 보입니다. 여성은 좀 더 캐주얼한 검은색 테 안경을 쓰고 화려한 블라우스를 입고 있습니다.
두 이미지 모두 자수 예술을 강조하지만 Dall-E 3는 우아함을 지향하는 반면 Midjourney는 아늑하고 정통적인 느낌을 줍니다.
픽셀 아트
프롬프트: 픽셀화된 마법에 걸린 숲 배경을 배경으로 마법 입자와 떠다니는 주문서를 사용하여 주문을 시전하는 마법사

왼쪽에서 Dall-E 3는 긴 모자를 쓰고 진한 파란색 망토를 입은 마법사가 있는 숲 배경의 픽셀화된 이미지를 제공하여 구식 비디오 게임 분위기를 재현합니다. 그의 주위에 소용돌이치는 마법 입자와 빛나는 페이지를 보여주는 활짝 열려 있는 떠다니는 주문서를 볼 수 있습니다.
이제 오른쪽에서 Midjourney가 보다 현실적인 그림을 그립니다. 마법사는 주문을 시전하는 행위에 깊이 빠져 있는 젊고 강렬해 보이는 남자로 묘사됩니다. 그가 들고 있는 빛나는 구체 모양의 주문서를 둘러싼 마법 입자가 생생하게 보입니다. 숲 배경은 분명하지만 프롬프트에서 요청한 대로 픽셀화되지 않습니다.
두 이미지 모두 주문을 시전하는 마법사를 훌륭하게 묘사하고 있지만 Dall-E 3만이 '픽셀화된' 세부 묘사를 구현했습니다.
초현실주의 미술
프롬프트: 떠다니는 섬에 있는 주의 깊은 작은 코끼리 무리에게 책을 읽어주는 특대 나비

두 이미지는 모두 동일한 프롬프트를 사용하여 생성되지만 매우 다른 장면을 그립니다. Dall-E 3의 이미지는 생동감 넘치고 재미있습니다. 코끼리 머리를 가진 나비가 떠다니는 땅 위의 작은 코끼리들에게 책을 읽어주는 모습을 보여줍니다.

반면 미드저니의 이미지는 거대한 코끼리 섬과 다양한 활동을 하고 있는 수많은 작은 코끼리들로 황홀한 정글 느낌을 풍긴다. 그러나 Midjourney의 버전은 "대형 나비"의 중심 요소를 놓치고 있습니다.
평면 디자인
프롬프트: 도쿄 타워, 스시롤, 벚꽃 가지 등 상징적인 실루엣을 통해 도쿄의 본질을 보여주는 미니멀리스트 엽서

두 이미지 모두 도쿄 타워, 스시, 벚꽃을 사용하여 도쿄의 본질을 포착합니다. Dall-E 3 버전은 밝은 배경과 함께 상세한 도시 풍경과 스시 롤을 보여주며, 벚꽃이 무성해 생동감이 넘칩니다.
대조적으로 Midjourney는 파스텔 색상, 단순화된 구조 및 적은 수의 벚꽃을 사용하여 차분하고 미니멀한 접근 방식을 취합니다.
두 창작물 모두 요청된 요소를 포함하지만 Dall-E 3는 강 및 다리와 같은 추가 기능을 추가합니다. 품질 측면에서 Dall-E의 이미지는 디테일이 더욱 풍부하고 Midjourney의 이미지는 단순함과 개방적인 공간을 우선시합니다.
3D 렌더링
프롬프트: 벨벳 배경에 섬세한 은색 체인에 매달려 있는 루비 눈을 가진 상세한 3D 렌더링 옥 드래곤 펜던트

달이의 펜던트(왼쪽)는 그린 컬러로 '옥' 룩과 잘 어울리고 루비 레드 눈을 갖고 있지만 실버 체인이 생각보다 두꺼워 보인다. 배경은 벨벳처럼 보입니다.
미드저니의 펜던트(오른쪽)는 옥처럼 보이지 않고 금속적인 느낌이 강하지만 루비색 눈이 눈에 띕니다. 여기 체인은 더 자세하고 배경은 어둡습니다. 프롬프트와 비교했을 때 Dall-E의 이미지는 '옥'과 '벨벳 배경' 디테일에 더 잘 어울리는 반면, Midjourney는 '실버 체인' 측면을 잘 보여줍니다.
디지털 일러스트레이션
프롬프트: 옆에 있는 앵무새가 경고를 외치는 동안 그릇에서 물고기를 몰래 빼내려고 하는 장난꾸러기 고양이의 디지털 일러스트레이션

두 사진 모두 근처에 앵무새가 있는 고양이가 그릇에서 물고기를 꺼내려고 노력하는 모습을 담고 있습니다. 왼쪽의 Dall-E 3 이미지에는 회색 줄무늬 고양이가 조용히 물을 만지고 있고, 앵무새는 지켜보고 있습니다.
오른쪽 Midjourney 사진에서는 고양이가 놀란 표정을 하고 있고 앵무새는 없습니다. Dall-E의 사진은 디테일과 질감이 더 살아있어 더욱 세련된 느낌을 줍니다. Midjourney의 이미지는 급하게 느껴지고 요소가 누락되어 더 어두운 설정을 가지고 있습니다.
오일 페인팅
프롬프트: 낡은 나침반을 들고 떠들썩한 바다와 폭풍우 구름을 배경으로 생각에 잠긴 엄숙한 선원

Dall-E 3가 만든 왼쪽 이미지에는 폭풍우가 치는 바다를 배경으로 사려 깊은 표정을 짓고 있는 나이든 선원이 있습니다. Midjourney의 오른쪽 작품은 더 잔잔한 바다를 바라보고 있는 젊은 선원의 모습을 담고 있습니다. 두 사진 모두 메시지와 일치하지만 폭풍우가 치는 배경으로 인해 Dall-E의 사진이 더 가까워 보입니다. 화질은 둘 다 좋지만 서로 다른 느낌을 줍니다. 하나는 지난 모험을 되돌아보는 느낌이고, 다른 하나는 새로운 모험을 준비하는 느낌입니다.
디오라마
프롬프트: 작동하는 관람차, 솜사탕을 즐기고 있는 작은 방문객, 디오라마 스타일로 빛나는 구체를 저글링하는 광대가 있는 미니어처 카니발 장면

두 이미지 모두 관람차가 달린 미니어처 카니발 장면을 보여줍니다. Dall-E 3의 왼쪽 이미지에는 솜사탕을 들고 있는 방문객과 빛나는 구체를 저글링하는 광대가 있는데, 이는 프롬프트에 잘 들어맞습니다. Midjourney의 오른쪽 이미지는 밤의 느낌과 더 복잡한 디자인을 가지고 있지만 방문자에게 솜사탕이나 저글링하는 광대를 보여주지는 않습니다. 두 이미지 모두 품질이 좋지만 Dall-E의 이미지는 프롬프트의 세부 사항에 더 가깝게 정렬되는 반면 Midjourney의 이미지는 독특한 테이크를 제공하지만 작은 방문자가 그다지 명확하지 않습니다.
건축학
프롬프트: 나선형 계단, 매달린 랜턴, 책으로 가득한 발코니가 있는 기발한 나무집 도서관

Dall-E 3의 왼쪽 이미지는 많은 디테일, 랜턴, 더 큰 나무 위의 집으로 인해 더욱 환상적입니다. Midjourney의 올바른 이미지는 방과 랜턴이 적어 실제 생활에 더 가까운 느낌을 줍니다. 두 사진 모두 나선형 계단과 책 발코니가 있는 '나무집 도서관'이라는 아이디어를 담고 있습니다. 둘 다 프롬프트를 잘 따릅니다.
하지만 Dall-E의 사진은 초록빛 빛이 더해져 더욱 몽환적인 느낌을 주는 반면, Midjourney의 사진은 저녁을 배경으로 한 듯 포근한 느낌을 줍니다.
두 이미지 모두 고품질이지만 둘 중 하나를 선택하는 것은 좀 더 마술적인 모습을 원하는지 아니면 사실적인 모습을 원하는지 여부에 달려 있습니다.
인테리어 디자인
프롬프트: 해먹 침대, 벽에 태피스트리, 모자이크 거울, 천장에 매달린 식물이 있는 보헤미안 침실

두 이미지 모두 보헤미안 침실 느낌을 포착합니다. Dall-E의 이미지(왼쪽)는 다채로운 패턴과 해먹 모양의 좌석, 투명한 태피스트리, 많은 매달린 식물을 갖추고 있지만 모자이크 거울이 부족합니다.
Midjourney의 이미지(오른쪽)는 식물과 레이스 태피스트리를 사용하여 더 가볍고 더 넓지만 침대는 해먹 스타일이 아니며 눈에 띄는 모자이크 거울이 없습니다.
두 이미지 모두 보호 요소와 매달린 식물이 있지만 특히 모자이크 거울과 정확한 해먹 침대 설명과 관련하여 메시지와 완전히 일치하지 않습니다.
높은 상황에 맞는 프롬프트
프롬프트: 정교한 도구, 빛나는 대장간, 복잡한 갑옷 조각, 작업 중인 장인이 있는 르네상스 시대의 대장장이 작업장

Dall-E의 왼쪽은 대장장이 한 명과 깔끔하게 정리된 도구, 그리고 강조된 갑옷이 있습니다. Midjourney의 오른쪽에는 여러 사람이 있고 도구가 흩어져 있으며 활기찬 분위기가 있습니다. 둘 다 작업장을 묘사하는 반면 Dall-E 이미지는 한 명의 장인과 그의 도구에 초점을 맞추고 있으며 Midjourney 이미지는 여러 명의 작업자가 있는 바쁜 하루처럼 느껴집니다.
낮은 상황에 맞는 프롬프트
제 목 : 달빛 아래 춤을 춰요

두 이미지 모두 "달빛 춤"을 선보입니다. Dall-E의 왼쪽 이미지는 큰 달을 배경으로 실루엣이 있는 댄서들이 있는 생동감 넘치는 푸른 톤을 가지고 있는 반면, Midjourney의 오른쪽 이미지는 더 은은한 달빛으로 댄서들을 더 가까이서 자세히 보여줍니다. Dall-E는 환경과 대조에 초점을 맞추고 Midjourney는 댄서의 감정을 강조합니다. 둘 다 달빛 댄스 테마를 포착하지만 스타일은 다릅니다.
대박: Midjourney vs Dall-E 3
Dall-E 3와 Midjourney의 AI 생성 이미지 16개를 평가한 결과, Dall-E 3가 복잡한 세부 사항을 포착하는 데 탁월하다는 것이 분명해졌습니다. 또한 이 플랫폼은 관련 이미지를 생성하라는 메시지의 의도를 해석하는 측면에서 Midjourney를 능가합니다. 반면에 Midjourney는 실제처럼 보이는 비주얼을 만드는 데 우위를 점하고 있습니다. Dall-E 3는 완벽함을 목표로 하지만 때로는 덜 자연스러운 이미지를 생성할 수 있습니다.
AI 비주얼의 세부 사항을 찾는 기업의 경우 Dall-E 3가 더 적합한 선택일 수 있습니다. 곧 ChatGPT Plus와 최고의 AI 이미지 생성기인 Photosonic을 통해 액세스할 수 있습니다. OpenAI는 곧 Dall-E 3 API를 출시하여 이를 Photosonic의 통합 기능으로 만들 계획입니다.
자주 묻는 질문
1. Midjourney가 DALL-E 3보다 나은가요?
실제로 하나가 다른 것보다 완전히 "더 낫다"는 것은 아닙니다. 그들은 서로 다른 스타일과 능력을 가지고 있습니다. DALL-E 3은 ChatGPT Plus와 통합되어 있으며 GPT-4와 함께 제공되는 패키지의 일부입니다. 반면에 Midjourney는 렌더링에 변형을 제공할 수 있습니다. 그것은 당신의 개인적인 취향과 당신이 찾고 있는 스타일에 관한 것입니다.
2. DALL-E 3는 무료인가요?
아니요, DALL-E 3는 무료가 아닙니다. 월 $20의 비용이 드는 ChatGPT Plus와 함께 번들로 제공됩니다. 이 구독을 이용하면 GPT-4에 대한 액세스 권한도 부여됩니다.
3. DALL-E 3와 Midjourney 중 어느 것이 더 저렴합니까?
숫자를 엄밀히 살펴보면 Midjourney는 월 $10의 저렴한 가격으로 시작합니다. DALL-E 3에는 ChatGPT Plus가 함께 제공되며 가격은 월 $20입니다. 따라서 예산이 핵심 요소라면 Midjourney가 더 비용 효율적인 옵션일 수 있습니다.