AI Wiki Kunst Teknologier
Oktober 02, 2023

Dall-E 3 vs. Midjourney: En stor sammenligning af de mest avancerede AI-kunstgeneratorer

Tag med os på denne spændende rejse, mens vi udforsker Dall-E 3 og Midjourneys subtiliteter, kompleksiteter og uudnyttede potentialer. Denne artikel fremhæver de mest spændende sammenligninger baseret på forskning udført af AI-entusiasten Atachkina; hvis du er interesseret i at lære mere, så klik på link.

Dall-E 3 vs. Midjourney: En stor sammenligning af de mest avancerede AI-kunstgeneratorer
Pro Tips
1. Afdække Top 50 tekst-til-billede-prompter til AI Art Generatorer Midjourney og DALL-E.
2. Tænd din kreativitet med Top 20 AI tekst-til-billede kunstgeneratorer af 2023.

Denne artikel giver en tekst-til-billede prompt, et billede, der viser resultaterne fra Dall-E 3 og Midjourney, og en forklaring på forskellene mellem de to kunst generatorer. Lad os begynde.

prompt: En rummand står på Jupiter og observerer solopgangen. futuristisk grænseflade, førstepersonsperspektiv, rumkommandant, regnmåler og HUD Rise UI

Begge neurale netværk klarede sig beundringsværdigt i dette tilfælde, med Midjourney en smule bedre end de andre.

prompt: skudt af Slim Aarons fra Wonder Woman i rummet, komplekse lag og teksturer, detaljeret karakterdesign, baggrund med lyse, finurlige og farverige scener, pastelfarvekorrektion som Wes Anderson-film, filmkorn og Tokina AT-X 11-16mm f /2.8 pro dx ii

Dall-E 3 gjorde et meget værre stykke arbejde her; det fik stilarternes lyse farver, men ikke detaljernes klarhed; deforme kroppe dukkede op i baggrunden, og ansigterne var slet ikke vellykkede.

prompt: billede af en sød, buttet cybercot i hans onlinebolig
prompt: professionel kommerciel studiefotografering til Nike; model med langt hår; helkropsskud; iført beige Nike T-shirt; usædvanlig Nike denim jakke; blød beige plys nike taske; bløde lilla nike sneakers; stående på lys pink-blå baggrund; futuristisk baggrund af en kompleks strømlinet form med baggrundsbelysning; skudt på Hasselblad X1D;

Det viste sig at være interessant begge steder, men Dall-E 3 kæmpede igen med ansigterne. I stedet lavede den en plys beige taske som anvist i prompten, og Midjourney ignorerede det. I dette tilfælde var Dall-E 3 meget lydig til at udføre prompten.

prompt: strålesporet boblefigur i pastelfarver, kvindelig skulptur med metalliske finish, skinnende/blank, livlig turbulens, pigeoncore, utraditionelle positurer, anamorfisk kunst, iriserende/opalescens, videofeedback loops, skinnende øjne, dristige kurver, skinnende, flydende figuratisme
prompt: en vintage retro collage af superhelte, inklusive Wonder Woman, Captain America, Batman og The Joker

Og endnu en gang, mens begge gitter laver fremragende collager, er Dall-E 3 mere tro mod prompten; den tilføjede kun de helte, vi specificerede, den kunne ikke blive til en joker, og den krydsede kaptajnen med Batman.

prompt: metallisk strålesporende klat, anamorfisk kunst, iøjnefaldende detaljer, præcisionistiske linjer, dristige kurver, skinnende, flydende figuratisme, pastelfarver, mørk baggrund
prompt: Simple lag og teksturer, indviklet karakterdesign, levende, finurlige og farverige baggrunde, pastelfarvekorrektion a la Wes Anderson-film, filmkorn og et Tokina at-x 11-16mm f/2.8 pro dx ii-objektiv er alle til stede i dette billede af Spider-Man slapper af på en sofa taget af Slim Aarons.

Midjourney var i stand til at kombinere de to kunstneres respektive stilarter fra prompten, hvorimod Dall-E 3 blot tilføjede en masse travle detaljer og klare farver til baggrunden.

prompt: 80'er-fotografi af buttede søde fede katte, der deltager i en aerobictime, mens de sportede underholdende leopardleggings og lyserøde bodysuits, blev taget på Kodak Gold 200.

Endnu en gang er kattene i topform, og begge neurale netværk forstår filmkameraer perfekt. Dog tilføjer Dall-E 3 endda korn til billederne.

1990'erne, Leonardo DiCaprio spiller en Jedi-mester på en russisk dacha, mens han svinger et lyssværd og har en strikket grøn trøje på.

Dall-E 3 skabte en ung Leonardo DiCaprio med cool jumper-teksturer, tilføjet filmkorn og farveskema og afspejlede meget køligt følelsen af ​​en russisk dacha. Midjourney var en god farvereflektor til filmen, og DiCaprio gav hende et mere modent udseende.

prompt: en collage af Star wars billeder i vintage retrostil

Selvom begge neurale netværk er dygtige til at lave collager, hvis du ser godt efter, Midjourney forvrænger ansigter og nogle objektformer, mens Dall-E 3 er mere præcis i udførelsen af ​​selve karaktererne – det viste sig endda at være Chewbacca.

prompt: et billede af en russisk gorgon medusa iført Balenciaga hypebeast streetwear og slentrer ned ad en gade på Manhattan med slanger til håret

Når du zoomer ind på billederne, vil du bemærke, at Dall-E 3 har slørede øjne; Midjourney, på den anden side er fejlfri. Dall-E 3 foreskrev også et mærke; slangerne på hovederne ser ud til at være mere levende og i bevægelse; Midjourney altid gjort dem liggende, snarere end på hovedet.

Spørgsmål: Dette prisvindende fotografi af Slim Aarons viser en edderkoppemand forklædt som en fe iført en lyserød, blød kjole og holder en tryllestav. Det er taget med et Fuji Superia X-TRA 800 kamera.

Begge er seje, men Midjourney overvejede kunstnerens stil såvel som effekten af ​​et filmkamera, hvorimod Dall-E 3 ignorerede fuldlængdebilledet og ikke overvejede det.

prompt: USSR fe med vinger og et astronautkostume

Vi tog også beslutningen om at teste et billede med feer, men Dall-E 3 nægtede hårdnakket at samarbejde. Midjourney ignorerede ikke vingerne, fordi referencen med vinger var blevet tilføjet. Da Dall-E 3 tog et billede, bød det på nogle spændende muligheder, men med en amerikansk kvinde.

prompt: en snegl, der poserer til et portræt, mens han er iført moderne hipster-påklædning, 4K komplekse lag og teksturer, detaljeret karakterdesign og filmkorn. Baggrunden byder på livlige, finurlige og farverige scener.

Midjourney gjorde et fantastisk stykke arbejde, men vi vil gerne gøre opmærksom på, hvordan Dall-E 3 skabte filmeffekterne i øverste højre billede og tilføjede egen hvid håndskrift; det blev flot.

prompt: Spider-Man, Batman og Iron Man fandt sammen til en øl på en bar.

Dall-E 3 var i stand til meget lydigt at realisere alle promptens helte på ét billede igen. Midjourney prøvede meget og var endda tæt på at lykkes.

Spørgsmål: Sommersalat med tomater og agurker, makro, fuld scene, varme farver, højkvalitets fotorealistisk hyperrealistisk, naturlig belysning, Unreal Engine 5, farvegradering, redaktionel fotografering, fotografering, fotoshoot, Høj, episk, artgerm, skudt med et 70 mm objektiv, Dybdeskarphed, DOF, Tilt Blur, Lukkerhastighed 1/1000, F/22, Hvidbalance, 32k, Super-opløsning

Ved første øjekast ser det ud til, at begge dele er gode, men nærmere eftersyn afslører, at Dall-E 3 mangler fotorealistisk volumen, og at Midjourney håndterede leddene med gafler med et brag.

prompt: en McDonald's i stil med fantasifulde rumlandskaber med realistiske menneskefigurer, to biler og en traktor med en måne over sig. Les Nasbis, Pierre Pellegrini, videnskabsbaseret, banebrydende fed mætning, firecore

Begge generatorer er dygtige inden for deres respektive områder, hvor Dall-E 3 udmærker sig i tekst og Midjourney udmærker sig i fotorealisme.

Hårtørreren BaByliss D570DE bruges i et moderne interiør med aftenbelysning, industrielt design og pastelfarver, perfekt til studieoptagelser.

Fysikken og geometrien af ​​hårtørrere er svære for Midjourney. Du kan bruge meget tid på at kæmpe med forsøg og referencer, og nogle gange ligner resultaterne en hårtørrer, men Dall-E 3 gav et acceptabelt resultat i første forsøg og skrev endda teksten.

prompt: foto af enøjede Turanga Leela fra futurama

Det eneste øje er godt, men det er en anden historie. I Midjourney, vi skrev en negativ prompt – ingen tegneserie, illustration, flad, to øjne. Dall-E 3 adlød straks og fik det ene øje, et smil og en hat af, men den nægtede blankt at lade nogen tage hendes billede.

Skuespilleren Brad Pitt ses i 1990'erne vande køkkenhavens bede på en russisk dacha, mens han er iført stribet tanktop og joggingbukser fra adidas. Scenen blev optaget på Agfa Vista 400.

Midjourney gjorde, at generationen ikke kunne lide Brad, så vi brugte ekstratjenesten Insight Face Swap at sætte Brads ansigt på generationen; der var et indlæg om det her. Dall-E 3 ved, hvem Brad Pitt er og kan tegne stjerner uden yderligere software.

prompt: en smuk pige, enhjørninger, æbleteknologier og en vintage retro collage af galakser

Begge masker er gode, men Dall-E 3 kan skabe enhjørningshorn mens Midjourney typisk ikke kan.

prompt: is i hånden, nike sportstøj og en fantastisk fantasy alf, der sidder ved siden af ​​en ork på et gadebillede.

Dall-E 3 gjorde et godt stykke arbejde med at sætte karaktererne i handling; vi kan se en ork og en nisse med nisseører. Der er også en person iført en Nike træningsdragt, men deres øjne er udtværede. De elverspidse ører ignoreres for det meste af Midjourney, og Nike bliver også tilsidesat.

prompt: tegning af en USSR-fe klædt som astronaut

Da efterskriftet "illustration" oprindeligt blev udeladt af prompten, oprettede Dall-E 3 en. Så besluttede vi at sammenligne det med Midjourneys illustration. Mens Midjourney mere lignede sovjettidens illustrationer og ikke inkluderede eventyrvingerne, gjorde Dall-E 3 et fantastisk stykke arbejde med at tegne hammer og segl. Eksemplet til højre viser, hvordan Dall-E 3 kan fremstå i teksten.

prompt: En dacha på Jupiter, planetens orbitalringe kan ses i det fjerne, et rumvæsen laver en grill, indviklede karakterdesigns, lyse, skøre og farverige baggrunde, pastelfarvekorrektion a la Wes Anderson-film, filmkorn og en Tokina AT -X 11-16mm f/2.8 Pro dX II objektiv

Imidlertid Midjourney gik ind i fotorealisme; der er ingen hovedperson i billederne, kun omgivelserne, men stadig cool. Dall-E 3 ønskede ikke at være med på billedet igen.

prompt: filmkorn, hundemad, indviklet karakterdesign, lag og teksturer, lyse, skøre og farverige scener i baggrunden og pastelfarvekorrektion som i en Wes Anderson-film

Dall-E 3 vs. Midjourney: Fordele og ulemper

Efterhånden som brugerne udforsker denne teknologi, er flere bemærkelsesværdige styrker og begrænsninger kommet frem i lyset, hvilket giver yderligere indsigt i dens funktionalitet.

Fordele:

  1. Hurtig lydighed: En af de iøjnefaldende egenskaber ved Dall-E 3 er dens bemærkelsesværdige evne til at følge anvisninger nøjagtigt. Brugere har rapporteret, at AI-modellen reagerer effektivt på en lang række input, hvilket gør den til et alsidigt værktøj til forskellige opgaver.
  2. Multifacetteret kreativitet: Dall-E 3 udviser evnen til at skildre flere karakterer i et enkelt billede, hvilket udvider dets potentiale for historiefortælling og kreative projekter. Denne mangefacetterede tilgang forbedrer dens anvendelighed på tværs af forskellige domæner.
  3. Tekstintegration: Brugere har bemærket Dall-E 3's færdigheder i at integrere tekst problemfrit i billeder. Denne funktion letter oprettelsen af ​​visuelt engagerende indhold med indlejrede tekstelementer.

Ulemper:

  1. Billedklarhed: En bemærkelsesværdig begrænsning er AI'ens tendens til at producere billeder med slørede ansigter og øjne. Selvom det udmærker sig i kreativitet, mangler det nogle gange den klarhed og præcision, der ses i menneskeskabt indhold.
  2. Stilkonsistens: Dall-E 3 kopierer ikke konsekvent specifikke kunstneres stilarter, hvilket kan være en ulempe for dem, der søger præcis kunstnerisk emulering.
  3. VPN-krav: Adgang til Dall-E 3 kræver i øjeblikket brugen af ​​en VPN, hvilket kan udgøre tilgængelighedsudfordringer for nogle brugere.
  4. Billedhåndtering: Brugere er stødt på begrænsninger, når de administrerer genererede billeder på Microsoft Bing-webstedet. Navnlig er der ingen formatorienteringsfunktion, og billedhistorikken er begrænset til nylige uploads, hvilket kræver øjeblikkelig kopiering til senere brug.
  5. Generationshastighed: I nogle tilfælde er genereringsprocessen i Dall-E 3 blevet rapporteret at være langsommere sammenlignet med andre AI-modeller.

På trods af disse begrænsninger har Dall-E 3 et betydeligt løfte. Både brugere og eksperter anerkender dets potentiale til at revolutionere indholdsskabelse og historiefortælling. Som OpenAI fortsætter med at forfine og udvide sine tilbud, forventes det, at Dall-E 3s styrker vil skinne endnu klarere, hvilket gør det til et værdifuldt værktøj på forskellige områder.

Ofte Stillede Spørgsmål

Både Dall-E 3 og Midjourney har deres styrker og svagheder. Dall-E 3 er især lydig over for prompter og kan integrere tekst problemfrit i billeder. Det producerer dog nogle gange billeder med slørede ansigter og øjne og kopierer muligvis ikke konsekvent specifikke kunstneres stilarter. På den anden side, Midjourney udmærker sig i fotorealisme, men fanger måske ikke altid essensen af ​​visse prompter så præcist som Dall-E 3.

Artiklen giver tekst-til-billede prompter, der viser resultaterne fra både Dall-E 3 og Midjourney, og forklarer forskellene mellem de to kunstgeneratorer.

Begge AI-modeller har deres styrker og svagheder. For eksempel, i en prompt om en rummand på Jupiter, Midjourney bedre end Dall-E 3. I en anden prompt om Wonder Woman var Dall-E 3 dog mere præcis til at fange essensen af ​​prompten.

  • Hurtig lydighed: Dall-E 3 følger nøjagtigt anvisninger.
  • Multifacetteret kreativitet: Den kan afbilde flere karakterer i et enkelt billede.
  • Tekstintegration: Dall-E 3 kan problemfrit integrere tekst i billeder.
  • Billedets klarhed: Den producerer nogle gange billeder med slørede ansigter og øjne.
  • Stilkonsistens: Dall-E 3 kopierer ikke konsekvent specifikke kunstneres stilarter.
  • Billedhåndtering: Der er begrænsninger ved håndtering af genererede billeder på Microsoft Bing-webstedet.
  • Generationshastighed: Dall-E 3's generationsproces kan være langsommere sammenlignet med andre AI-modeller.

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Radiant Capital initierer RFP-34-forslag, foreslår weETH onboarding i sine Ethereum- og arbitrum-implementeringer
Nyheds rapport Teknologier
Radiant Capital initierer RFP-34-forslag, foreslår weETH onboarding i sine Ethereum- og arbitrum-implementeringer
Maj 7, 2024
Crypto Exchange Binance til at lancere nye handelspar og aktivere handelsbots den 8. maj
Markeder Nyheds rapport Teknologier
Crypto Exchange Binance til at lancere nye handelspar og aktivere handelsbots den 8. maj
Maj 7, 2024
Stacks, Moonriver Network, Hedera og Iron Fish til at deltage i Axelars Interchain Amplifier Program
Nyheds rapport Teknologier
Stacks, Moonriver Network, Hedera og Iron Fish til at deltage i Axelars Interchain Amplifier Program
Maj 7, 2024
Tesla omfavner Dogecoin: Stort boost for Meme-mønten, da den bliver en betalingsmulighed i Teslas onlinebutik
Markeder Historier og anmeldelser Teknologier
Tesla omfavner Dogecoin: Stort boost for Meme-mønten, da den bliver en betalingsmulighed i Teslas onlinebutik
Maj 7, 2024