Dall-E 3 vs. Midjourney: En stor sammenligning af de mest avancerede AI-kunstgeneratorer
Tag med os på denne spændende rejse, mens vi udforsker Dall-E 3 og Midjourneys subtiliteter, kompleksiteter og uudnyttede potentialer. Denne artikel fremhæver de mest spændende sammenligninger baseret på forskning udført af AI-entusiasten Atachkina; hvis du er interesseret i at lære mere, så klik på link.
Pro Tips |
---|
1. Afdække Top 50 tekst-til-billede-prompter til AI Art Generatorer Midjourney og DALL-E. |
2. Tænd din kreativitet med Top 20 AI tekst-til-billede kunstgeneratorer af 2023. |
Denne artikel giver en tekst-til-billede prompt, et billede, der viser resultaterne fra Dall-E 3 og Midjourney, og en forklaring på forskellene mellem de to kunst generatorer. Lad os begynde.
Begge neurale netværk klarede sig beundringsværdigt i dette tilfælde, med Midjourney en smule bedre end de andre.
Dall-E 3 gjorde et meget værre stykke arbejde her; det fik stilarternes lyse farver, men ikke detaljernes klarhed; deforme kroppe dukkede op i baggrunden, og ansigterne var slet ikke vellykkede.
Det viste sig at være interessant begge steder, men Dall-E 3 kæmpede igen med ansigterne. I stedet lavede den en plys beige taske som anvist i prompten, og Midjourney ignorerede det. I dette tilfælde var Dall-E 3 meget lydig til at udføre prompten.
Og endnu en gang, mens begge gitter laver fremragende collager, er Dall-E 3 mere tro mod prompten; den tilføjede kun de helte, vi specificerede, den kunne ikke blive til en joker, og den krydsede kaptajnen med Batman.
Midjourney var i stand til at kombinere de to kunstneres respektive stilarter fra prompten, hvorimod Dall-E 3 blot tilføjede en masse travle detaljer og klare farver til baggrunden.
Endnu en gang er kattene i topform, og begge neurale netværk forstår filmkameraer perfekt. Dog tilføjer Dall-E 3 endda korn til billederne.
Dall-E 3 skabte en ung Leonardo DiCaprio med cool jumper-teksturer, tilføjet filmkorn og farveskema og afspejlede meget køligt følelsen af en russisk dacha. Midjourney var en god farvereflektor til filmen, og DiCaprio gav hende et mere modent udseende.
Selvom begge neurale netværk er dygtige til at lave collager, hvis du ser godt efter, Midjourney forvrænger ansigter og nogle objektformer, mens Dall-E 3 er mere præcis i udførelsen af selve karaktererne – det viste sig endda at være Chewbacca.
Når du zoomer ind på billederne, vil du bemærke, at Dall-E 3 har slørede øjne; Midjourney, på den anden side er fejlfri. Dall-E 3 foreskrev også et mærke; slangerne på hovederne ser ud til at være mere levende og i bevægelse; Midjourney altid gjort dem liggende, snarere end på hovedet.
Begge er seje, men Midjourney overvejede kunstnerens stil såvel som effekten af et filmkamera, hvorimod Dall-E 3 ignorerede fuldlængdebilledet og ikke overvejede det.
Vi tog også beslutningen om at teste et billede med feer, men Dall-E 3 nægtede hårdnakket at samarbejde. Midjourney ignorerede ikke vingerne, fordi referencen med vinger var blevet tilføjet. Da Dall-E 3 tog et billede, bød det på nogle spændende muligheder, men med en amerikansk kvinde.
Midjourney gjorde et fantastisk stykke arbejde, men vi vil gerne gøre opmærksom på, hvordan Dall-E 3 skabte filmeffekterne i øverste højre billede og tilføjede egen hvid håndskrift; det blev flot.
Dall-E 3 var i stand til meget lydigt at realisere alle promptens helte på ét billede igen. Midjourney prøvede meget og var endda tæt på at lykkes.
Ved første øjekast ser det ud til, at begge dele er gode, men nærmere eftersyn afslører, at Dall-E 3 mangler fotorealistisk volumen, og at Midjourney håndterede leddene med gafler med et brag.
Begge generatorer er dygtige inden for deres respektive områder, hvor Dall-E 3 udmærker sig i tekst og Midjourney udmærker sig i fotorealisme.
Fysikken og geometrien af hårtørrere er svære for Midjourney. Du kan bruge meget tid på at kæmpe med forsøg og referencer, og nogle gange ligner resultaterne en hårtørrer, men Dall-E 3 gav et acceptabelt resultat i første forsøg og skrev endda teksten.
Det eneste øje er godt, men det er en anden historie. I Midjourney, vi skrev en negativ prompt – ingen tegneserie, illustration, flad, to øjne. Dall-E 3 adlød straks og fik det ene øje, et smil og en hat af, men den nægtede blankt at lade nogen tage hendes billede.
Midjourney gjorde, at generationen ikke kunne lide Brad, så vi brugte ekstratjenesten Insight Face Swap at sætte Brads ansigt på generationen; der var et indlæg om det her. Dall-E 3 ved, hvem Brad Pitt er og kan tegne stjerner uden yderligere software.
Begge masker er gode, men Dall-E 3 kan skabe enhjørningshorn mens Midjourney typisk ikke kan.
Dall-E 3 gjorde et godt stykke arbejde med at sætte karaktererne i handling; vi kan se en ork og en nisse med nisseører. Der er også en person iført en Nike træningsdragt, men deres øjne er udtværede. De elverspidse ører ignoreres for det meste af Midjourney, og Nike bliver også tilsidesat.
Da efterskriftet "illustration" oprindeligt blev udeladt af prompten, oprettede Dall-E 3 en. Så besluttede vi at sammenligne det med Midjourneys illustration. Mens Midjourney mere lignede sovjettidens illustrationer og ikke inkluderede eventyrvingerne, gjorde Dall-E 3 et fantastisk stykke arbejde med at tegne hammer og segl. Eksemplet til højre viser, hvordan Dall-E 3 kan fremstå i teksten.
Imidlertid Midjourney gik ind i fotorealisme; der er ingen hovedperson i billederne, kun omgivelserne, men stadig cool. Dall-E 3 ønskede ikke at være med på billedet igen.
Dall-E 3 vs. Midjourney: Fordele og ulemper
Efterhånden som brugerne udforsker denne teknologi, er flere bemærkelsesværdige styrker og begrænsninger kommet frem i lyset, hvilket giver yderligere indsigt i dens funktionalitet.
Fordele:
- Hurtig lydighed: En af de iøjnefaldende egenskaber ved Dall-E 3 er dens bemærkelsesværdige evne til at følge anvisninger nøjagtigt. Brugere har rapporteret, at AI-modellen reagerer effektivt på en lang række input, hvilket gør den til et alsidigt værktøj til forskellige opgaver.
- Multifacetteret kreativitet: Dall-E 3 udviser evnen til at skildre flere karakterer i et enkelt billede, hvilket udvider dets potentiale for historiefortælling og kreative projekter. Denne mangefacetterede tilgang forbedrer dens anvendelighed på tværs af forskellige domæner.
- Tekstintegration: Brugere har bemærket Dall-E 3's færdigheder i at integrere tekst problemfrit i billeder. Denne funktion letter oprettelsen af visuelt engagerende indhold med indlejrede tekstelementer.
Ulemper:
- Billedklarhed: En bemærkelsesværdig begrænsning er AI'ens tendens til at producere billeder med slørede ansigter og øjne. Selvom det udmærker sig i kreativitet, mangler det nogle gange den klarhed og præcision, der ses i menneskeskabt indhold.
- Stilkonsistens: Dall-E 3 kopierer ikke konsekvent specifikke kunstneres stilarter, hvilket kan være en ulempe for dem, der søger præcis kunstnerisk emulering.
- VPN-krav: Adgang til Dall-E 3 kræver i øjeblikket brugen af en VPN, hvilket kan udgøre tilgængelighedsudfordringer for nogle brugere.
- Billedhåndtering: Brugere er stødt på begrænsninger, når de administrerer genererede billeder på Microsoft Bing-webstedet. Navnlig er der ingen formatorienteringsfunktion, og billedhistorikken er begrænset til nylige uploads, hvilket kræver øjeblikkelig kopiering til senere brug.
- Generationshastighed: I nogle tilfælde er genereringsprocessen i Dall-E 3 blevet rapporteret at være langsommere sammenlignet med andre AI-modeller.
På trods af disse begrænsninger har Dall-E 3 et betydeligt løfte. Både brugere og eksperter anerkender dets potentiale til at revolutionere indholdsskabelse og historiefortælling. Som OpenAI fortsætter med at forfine og udvide sine tilbud, forventes det, at Dall-E 3s styrker vil skinne endnu klarere, hvilket gør det til et værdifuldt værktøj på forskellige områder.
Ofte Stillede Spørgsmål
Både Dall-E 3 og Midjourney har deres styrker og svagheder. Dall-E 3 er især lydig over for prompter og kan integrere tekst problemfrit i billeder. Det producerer dog nogle gange billeder med slørede ansigter og øjne og kopierer muligvis ikke konsekvent specifikke kunstneres stilarter. På den anden side, Midjourney udmærker sig i fotorealisme, men fanger måske ikke altid essensen af visse prompter så præcist som Dall-E 3.
Artiklen giver tekst-til-billede prompter, der viser resultaterne fra både Dall-E 3 og Midjourney, og forklarer forskellene mellem de to kunstgeneratorer.
Begge AI-modeller har deres styrker og svagheder. For eksempel, i en prompt om en rummand på Jupiter, Midjourney bedre end Dall-E 3. I en anden prompt om Wonder Woman var Dall-E 3 dog mere præcis til at fange essensen af prompten.
- Hurtig lydighed: Dall-E 3 følger nøjagtigt anvisninger.
- Multifacetteret kreativitet: Den kan afbilde flere karakterer i et enkelt billede.
- Tekstintegration: Dall-E 3 kan problemfrit integrere tekst i billeder.
- Billedets klarhed: Den producerer nogle gange billeder med slørede ansigter og øjne.
- Stilkonsistens: Dall-E 3 kopierer ikke konsekvent specifikke kunstneres stilarter.
- Billedhåndtering: Der er begrænsninger ved håndtering af genererede billeder på Microsoft Bing-webstedet.
- Generationshastighed: Dall-E 3's generationsproces kan være langsommere sammenlignet med andre AI-modeller.
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.
Flere artiklerDamir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.