AI Wiki Konst Teknologi
Oktober 02, 2023

Dall-E 3 vs. Midjourney: En stor jämförelse av de mest avancerade AI-konstgeneratorerna

Följ med oss ​​på denna spännande resa när vi utforskar Dall-E 3 och Midjourneys subtiliteter, komplexitet och outnyttjad potential. Den här artikeln belyser de mest spännande jämförelserna baserade på forskning gjord av AI-entusiasten Atachkina; om du är intresserad av att lära dig mer, klicka på länk.

Dall-E 3 vs. Midjourney: En stor jämförelse av de mest avancerade AI-konstgeneratorerna
Pro Tips
1. Avslöja Topp 50 text-till-bild-meddelanden för AI Art Generators Midjourney och DALL-E.
2. Tänd din kreativitet med Topp 20 AI text-till-bild konstgeneratorer av 2023.

Den här artikeln ger en text-till-bild-prompt, en bild som visar resultaten från Dall-E 3 och Midjourney, och en förklaring av skillnaderna mellan de två konstgeneratorer. Låt oss börja.

prompt: En rymdman står på Jupiter och observerar soluppgången. futuristiskt gränssnitt, förstapersonsperspektiv, rymdchef, regnmätare och HUD Rise UI

Båda neurala nätverken presterade beundransvärt i detta fall, med Midjourney något bättre än de andra.

uppmaning: fotad av Slim Aarons från Wonder Woman i rummet, komplexa lager och strukturer, detaljerad karaktärsdesign, bakgrund med ljusa, nyckfulla och färgglada scener, pastellfärgskorrigering som Wes Anderson-filmer, filmkorn och Tokina AT-X 11-16mm f /2.8 pro dx ii

Dall-E 3 gjorde ett mycket sämre jobb här; det fick stilarnas ljusa färger, men inte klarheten i detaljerna; deformerade kroppar dök upp i bakgrunden, och ansiktena var inte alls framgångsrika.

prompt: bild på en söt, knubbig cybercot i hans onlinebostad
prompt: professionell kommersiell studiofotografering för Nike; modell med långt hår; helkroppsskott; bär beige Nike T-shirt; ovanlig Nike jeansjacka; mjuk beige plysch nike-väska; mjuka lila nike sneakers; stående på ljusrosa-blå bakgrund; futuristisk bakgrund av en komplex strömlinjeformad form med bakgrundsbelysning; skjuten på Hasselblad X1D;

Det visade sig vara intressant båda ställena, men Dall-E 3 kämpade återigen med ansiktena. Istället gjorde det en plysch beige väska enligt instruktionerna i prompten, och Midjourney ignorerade det. I det här fallet var Dall-E 3 mycket lydig när det gäller att utföra uppmaningen.

prompt: strålspårad bubbelfigur i pastellfärger, kvinnlig skulptur med metalliska ytbehandlingar, glänsande/glänsande, livfull turbulens, duvekärna, okonventionella poser, anamorfisk konst, regnbågsskimrande/opalescens, videoåterkopplingsslingor, glänsande ögon, djärva kurvor, glänsande, flytande figuratism
prompt: ett vintage retrocollage av superhjältar, inklusive Wonder Woman, Captain America, Batman och The Joker

Och ännu en gång, medan båda rutnäten gör utmärkta collage, är Dall-E 3 mer trogen prompten; den lade bara till hjältarna vi specificerade, den kunde inte förvandlas till en joker, och den korsade kaptenen med Batman.

prompt: metallisk ray tracing blob, anamorfisk konst, iögonfallande detaljer, precisionistiska linjer, djärva kurvor, glänsande, flytande figuratism, pastellfärger, mörk bakgrund
uppmaning: Enkla lager och strukturer, intrikat karaktärsdesign, levande, nyckfulla och färgglada bakgrunder, pastellfärgskorrigering a la Wes Anderson-filmer, filmkorn och ett Tokina at-x 11-16mm f/2.8 pro dx ii-objektiv är alla närvarande i den här bilden av Spider-Man som kopplar av i en soffa tagen av Slim Aarons.

Midjourney kunde kombinera de två artisternas respektive stilar från prompten, medan Dall-E 3 bara lade till en massa upptagna detaljer och ljusa färger till bakgrunden.

Uppmaning: 80-talsfotografi av knubbiga söta feta katter som deltar i en aerobicsklass medan de sportade underhållande leopardleggings och rosa bodys togs på Kodak Gold 200.

Återigen är katterna i toppform, och båda neurala nätverk förstår filmkameror perfekt. Dall-E 3 tillför dock till och med korn till bilderna.

1990-talet, Leonardo DiCaprio spelar en jedimästare på en rysk dacha medan han svänger en ljussabel och bär en stickad grön tröja.

Dall-E 3 skapade en ung Leonardo DiCaprio med coola jumpertexturer, lagt till filmkorn och färgschema och återspeglade väldigt coolt känslan av en rysk dacha. Midjourney var en bra färgreflektor för filmen, och DiCaprio gav henne ett mer moget utseende.

prompt: ett collage av Star Wars bilder i vintage retrostil

Även om båda neurala nätverk är skickliga på att skapa collage, om du tittar noga, Midjourney förvränger ansikten och vissa objektformer, medan Dall-E 3 är mer exakt i utförandet av själva karaktärerna – det visade sig till och med vara Chewbacca.

uppmaning: en bild på en rysk gorgon medusa som bär Balenciaga hypebeast streetwear och promenerar nerför en gata på Manhattan med ormar för håret

När du zoomar in på fotografierna kommer du att märka att Dall-E 3 har suddiga ögon; Midjourney, å andra sidan, är felfri. Dall-E 3 skrev också ut ett märke; ormarna på huvudena verkar vara mer levande och i rörelse; Midjourney alltid gjort dem liggande, snarare än på huvudet.

Uppmaning: Detta prisbelönta fotografi av Slim Aarons visar en spindelman förklädd till en älva som bär en rosa fluffig klänning och håller i ett trollspö. Den är tagen med en Fuji Superia X-TRA 800-kamera.

Båda är coola, men Midjourney övervägde konstnärens stil såväl som effekten av en filmkamera, medan Dall-E 3 ignorerade fullängdsbilden och inte övervägde det.

uppmaning: Sovjetunionens älva med vingar och en astronautdräkt

Vi tog också beslutet att testa ett foto med älvor, men Dall-E 3 vägrade envist att samarbeta. Midjourney ignorerade inte vingarna eftersom referensen med vingar hade lagts till. När Dall-E 3 tog en bild bjöd den på några spännande möjligheter, men med en amerikansk kvinna.

uppmaning: en snigel som poserar för ett porträtt iförd modern hipsterklädsel, 4K komplexa lager och texturer, detaljerad karaktärsdesign och filmkorn. Bakgrunden har livfulla, nyckfulla och färgglada scener.

Midjourney gjorde ett fantastiskt jobb, men vi vill särskilt uppmärksamma hur Dall-E 3 skapade filmeffekterna i den övre högra bilden och lade till en egen vit handstil; det blev jättebra.

uppmaning: Spider-Man, Batman och Iron Man träffades för en öl på en bar.

Dall-E 3 kunde mycket lydigt realisera alla promptens hjältar i en bild igen. Midjourney försökte mycket och var till och med nära att lyckas.

Snabb: Sommarsallad med tomater och gurkor, makro, full scen, varma färger, högkvalitativ fotorealistisk hyperrealistisk, naturlig belysning, Unreal Engine 5, färggradering, redaktionell fotografering, fotografering, fotografering, lång, episk, artgerm, tagen med 70 mm objektiv, skärpedjup, DOF, lutningsoskärpa, slutartid 1/1000, F/22, vitbalans, 32k, superupplösning

Vid första anblicken verkar det som att båda är bra, men en närmare granskning avslöjar att Dall-E 3 saknar fotorealistisk volym och att Midjourney skötte skarvarna med gafflar med en smäll.

prompt: en McDonald's i stil med fantasifulla rymdlandskap med realistiska människofigurer, två bilar och en traktor, med en måne över sig. Les Nasbis, Pierre Pellegrini, vetenskapsbaserad, banbrytande djärv mättnad, firecore

Båda generatorerna är skickliga inom sina respektive områden, med Dall-E 3 utmärkande i text och Midjourney utmärker sig i fotorealism.

Hårtorken BaByliss D570DE används i en modern interiör med kvällsbelysning, industriell design och pastellfärger, perfekt för en studiofotografering.

Fysiken och geometrin hos hårtorkar är svåra för Midjourney. Du kan ägna mycket tid åt att kämpa med försök och referenser, och ibland liknar resultatet en hårtork, men Dall-E 3 gav ett acceptabelt resultat vid första försöket och skrev till och med texten.

uppmaning: foto av enögda Turanga Leela från futurama

Det enda ögat är bra, men det är en annan historia. I Midjourney, skrev vi en negativ uppmaning – ingen tecknad film, illustration, platt, två ögon. Dall-E 3 lydde omedelbart och gjorde ett öga, ett leende och en hatt av, men den vägrade bestämt att låta någon ta hennes bild.

Skådespelaren Brad Pitt ses på 1990-talet vattna grönsaksträdgårdens sängar på en rysk dacha iförd ett randigt linne och träningsbyxor från adidas. Scenen fångades på Agfa Vista 400.

Midjourney gjorde att generationen inte gillade Brad, så vi använde extratjänsten Insight Ansikts byte att sätta Brads ansikte på generationen; det var ett inlägg om det här. Dall-E 3 vet vem Brad Pitt är och kan rita stjärnor utan någon extra programvara.

uppmaning: en vacker flicka, enhörningar, apple-teknologier och ett vintage retrocollage av galaxer

Båda maskorna är bra, men Dall-E 3 kan skapa enhörningshorn medan Midjourney kan vanligtvis inte.

uppmaning: glass i handen, nike sportkläder och en fantastisk fantasitomte som sitter bredvid en orc på ett gatufoto.

Dall-E 3 gjorde ett bra jobb med att omsätta karaktärerna i handling; vi kan se en orc och en tomte med tomteöron. Det finns också en person som bär en Nike-träningsdräkt, men deras ögon är fläckiga. De älvspetsade öronen ignoreras mest av Midjourney, och Nike ignoreras också.

uppmaning: teckning av en USSR-älva klädd som en astronaut

När efterskriftens "illustration" ursprungligen utelämnades från prompten skapade Dall-E 3 en. Vi bestämde oss då för att jämföra det med Midjourneys illustration. Medan Midjourney Dall-E 3 gjorde ett fantastiskt jobb med att rita hammaren och skäran. Exemplet till höger visar hur Dall-E 3 kan se ut i texten.

prompt: En dacha på Jupiter, planetens omloppsringar kan ses i fjärran, en utomjording lagar en grill, intrikat karaktärsdesign, ljusa, galna och färgglada bakgrunder, pastellfärgskorrigering a la Wes Anderson-filmer, filmkorn och en Tokina AT -X 11-16mm f/2.8 Pro dX II-objektiv

Emellertid Midjourney gick in i fotorealism; det finns ingen huvudperson i bilderna, bara omgivningen, men ändå cool. Dall-E 3 ville inte vara med på bilden igen.

prompt: filmkorn, hundmat, invecklad karaktärsdesign, lager och texturer, ljusa, knäppa och färgglada scener i bakgrunden och pastellfärgskorrigering som i en Wes Anderson-film

Dall-E 3 vs. Midjourney: För-och nackdelar

När användare utforskar denna teknik har flera anmärkningsvärda styrkor och begränsningar kommit fram, vilket ger ytterligare insikt om dess funktionalitet.

Alla tillgångar på ett och samma ställe

  1. Snabb lydnad: En av de utmärkande egenskaperna hos Dall-E 3 är dess anmärkningsvärda förmåga att följa uppmaningar exakt. Användare har rapporterat att AI-modellen svarar effektivt på ett brett utbud av input, vilket gör den till ett mångsidigt verktyg för olika uppgifter.
  2. Mångfacetterad kreativitet: Dall-E 3 uppvisar förmågan att avbilda flera karaktärer i en enda bild, vilket utökar dess potential för berättande och kreativa projekt. Detta mångfacetterade tillvägagångssätt förbättrar dess användbarhet över olika domäner.
  3. Textintegration: Användare har noterat Dall-E 3:s skicklighet i att integrera text sömlöst i bilder. Den här funktionen underlättar skapandet av visuellt engagerande innehåll med inbäddade textelement.

Nackdelar:

  1. Bildens tydlighet: En anmärkningsvärd begränsning är AI:s tendens att producera bilder med suddiga ansikten och ögon. Även om det utmärker sig i kreativitet, saknar det ibland den klarhet och precision som ses i mänskligt genererat innehåll.
  2. Stilkonsistens: Dall-E 3 replikerar inte konsekvent specifika artisters stilar, vilket kan vara en nackdel för dem som söker exakt konstnärlig emulering.
  3. VPN-krav: Tillgång till Dall-E 3 kräver för närvarande användning av ett VPN, vilket kan innebära tillgänglighetsutmaningar för vissa användare.
  4. Bildhantering: Användare har stött på begränsningar när de hanterar genererade bilder på Microsoft Bing-webbplatsen. Noterbart finns det ingen formatorienteringsfunktion, och bildhistoriken är begränsad till senaste uppladdningar, vilket kräver omedelbar kopiering för senare användning.
  5. Generationshastighet: I vissa fall har genereringsprocessen i Dall-E 3 rapporterats vara långsammare jämfört med andra AI-modeller.

Trots dessa begränsningar har Dall-E 3 ett stort löfte. Både användare och experter inser dess potential att revolutionera innehållsskapande och berättande. Som OpenAI fortsätter att förfina och utöka sina erbjudanden, förväntas det att Dall-E 3:s styrkor kommer att lysa ännu starkare, vilket gör den till ett värdefullt verktyg inom olika områden.

Vanliga frågor

Både Dall-E 3 och Midjourney har sina styrkor och svagheter. Dall-E 3 är särskilt lydig mot uppmaningar och kan integrera text sömlöst i bilder. Men det ger ibland bilder med suddiga ansikten och ögon och kanske inte konsekvent replikerar specifika artisters stilar. Å andra sidan, Midjourney utmärker sig i fotorealism men kanske inte alltid fångar essensen av vissa uppmaningar lika exakt som Dall-E 3.

Artikeln ger text-till-bild-uppmaningar, som visar upp resultaten från både Dall-E 3 och Midjourney, och förklarar skillnaderna mellan de två konstgeneratorerna.

Båda AI-modellerna har sina styrkor och svagheter. Till exempel, i en uppmaning om en rymdman på Jupiter, Midjourney överträffade Dall-E 3 något. Men i en annan prompt om Wonder Woman var Dall-E 3 mer exakt när det gällde att fånga uppmaningens kärna.

  • Snabb lydnad: Dall-E 3 följer noggrant uppmaningar.
  • Mångfacetterad kreativitet: Den kan avbilda flera karaktärer i en enda bild.
  • Textintegration: Dall-E 3 kan sömlöst integrera text i bilder.
  • Bildtydlighet: Det ger ibland bilder med suddiga ansikten och ögon.
  • Stilkonsistens: Dall-E 3 replikerar inte konsekvent specifika artisters stilar.
  • Bildhantering: Det finns begränsningar när du hanterar genererade bilder på Microsoft Bing-webbplatsen.
  • Generationshastighet: Dall-E 3:s generationsprocess kan vara långsammare jämfört med andra AI-modeller.

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

Institutionell aptit växer mot Bitcoin ETFs mitt i volatilitet

Avslöjande genom 13F-anmälningar avslöjar anmärkningsvärda institutionella investerare som sysslar med Bitcoin ETF:er, vilket understryker en växande acceptans av ...

Lär dig mer

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Side Protocol lanserar Incentiviserat testnät och introducerar Insider Point System, vilket gör det möjligt för användare att tjäna SIDE-poäng
Marknader Nyhetsrapport Teknologi
Side Protocol lanserar Incentiviserat testnät och introducerar Insider Point System, vilket gör det möjligt för användare att tjäna SIDE-poäng
Maj 9, 2024
Web3 och kryptohändelser i maj 2024: Utforskar ny teknik och framväxande trender inom blockchain och DeFi
Smälta Företag Marknader Teknologi
Web3 och kryptohändelser i maj 2024: Utforskar ny teknik och framväxande trender inom blockchain och DeFi
Maj 9, 2024
Notcoin kommer att lanseras på OKX Jumpstart, erbjuder 1.25 % av det totala utbudet av token för gruvdrift
Marknader Nyhetsrapport Teknologi
Notcoin kommer att lanseras på OKX Jumpstart, erbjuder 1.25 % av det totala utbudet av token för gruvdrift
Maj 9, 2024
Puffer Finance lanserar sitt huvudnät, förbättrar inkluderingen av nodoperatörer för nätverksdecentralisering
Nyhetsrapport Teknologi
Puffer Finance lanserar sitt huvudnät, förbättrar inkluderingen av nodoperatörer för nätverksdecentralisering
Maj 9, 2024