Dall-E 3 vs. Midjourney: Een grote vergelijking van de meest geavanceerde AI-kunstgeneratoren
Ga met ons mee op deze spannende reis terwijl we Dall-E 3 en Midjourney's subtiliteiten, complexiteiten en onbenutte potentieel. Dit artikel belicht de meest intrigerende vergelijkingen gebaseerd op onderzoek gedaan door AI-liefhebber Atachkina; Als u meer wilt weten, klik dan op de link.
Pro Tips |
---|
1. Ontdek de Top 50 tekst-naar-afbeelding-prompts voor AI-kunstgeneratoren Midjourney en DALL-E. |
2. Stimuleer uw creativiteit met de Top 20 AI tekst-naar-beeld kunstgeneratoren van 2023. |
Dit artikel biedt een tekst-naar-afbeelding-prompt, een afbeelding die de resultaten van Dall-E 3 en Midjourneyen een verklaring van de verschillen tussen de twee kunst generatoren. Laten we beginnen.
Beide neurale netwerken presteerden in dit geval bewonderenswaardig, met de Midjourney iets beter presteren dan de anderen.
Dall-E 3 deed het hier veel slechter; het kreeg de felle kleuren van de stijlen, maar niet de helderheid van de details; misvormde lichamen verschenen op de achtergrond en de gezichten waren helemaal niet succesvol.
Het bleek beide plaatsen interessant te zijn, maar Dall-E 3 had opnieuw moeite met de gezichten. In plaats daarvan werd er een pluchen beige tas van gemaakt, zoals aangegeven in de prompt, en Midjourney negeerde het. In dit geval was Dall-E 3 zeer gehoorzaam bij het uitvoeren van de opdracht.
En nogmaals, hoewel beide rasters uitstekende collages maken, is Dall-E 3 trouwer aan de prompt; het voegde alleen de helden toe die we hadden gespecificeerd, het kon niet in een joker veranderen en het kruiste de kapitein met Batman.
Midjourney was in staat om de respectievelijke stijlen van de twee artiesten vanaf de prompt te combineren, terwijl Dall-E 3 gewoon veel drukke details en heldere kleuren aan de achtergrond toevoegde.
Opnieuw zijn de katten in topvorm en begrijpen beide neurale netwerken filmcamera's perfect. Dall-E 3 voegt echter zelfs korrel toe aan de foto's.
Dall-E 3 creëerde een jonge Leonardo DiCaprio met coole truitexturen, toegevoegde filmkorrels en kleurenschema en weerspiegelde op zeer koele wijze het gevoel van een Russische datsja. Midjourney was een goede kleurreflector voor de film, en DiCaprio gaf haar een volwassener uiterlijk.
Hoewel beide neurale netwerken zijn bedreven in het maken van collages, als je goed kijkt, Midjourney vervormt gezichten en sommige objectvormen, terwijl Dall-E 3 nauwkeuriger is in de uitvoering van de personages zelf: het bleek zelfs Chewbacca te zijn.
Als je inzoomt op de foto's, zul je merken dat Dall-E 3 wazige ogen heeft; Midjourneydaarentegen is onberispelijk. Dall-E 3 schreef ook een merk voor; de slangen op de hoofden lijken levendiger en in beweging; Midjourney liet ze altijd liggen, in plaats van op het hoofd.
Beide zijn cool, maar Midjourney hield zowel rekening met de stijl van de kunstenaar als met het effect van een filmcamera, terwijl Dall-E 3 de volledige opname negeerde en er geen rekening mee hield.
We hebben ook besloten om een foto met feeën te testen, maar Dall-E 3 weigerde hardnekkig mee te werken. Midjourney heb de vleugels niet genegeerd omdat de verwijzing met vleugels was toegevoegd. Toen Dall-E 3 een foto maakte, bood dat enkele intrigerende mogelijkheden, maar dan met een Amerikaanse vrouw.
Midjourney heeft fantastisch werk geleverd, maar we willen speciale aandacht vestigen op hoe Dall-E 3 de filmeffecten in de rechterbovenhoek creëerde en zijn eigen witte handschrift toevoegde; het bleek geweldig.
Dall-E 3 was in staat om alle helden van de prompt nogmaals heel gehoorzaam in één beeld te realiseren. Midjourney heel hard geprobeerd en zelfs bijna geslaagd.
Op het eerste gezicht lijkt het erop dat beide goed zijn, maar bij nadere inspectie blijkt dat de Dall-E 3 geen fotorealistisch volume heeft en dat Midjourney behandelde de gewrichten met vorken met een knal.
Beide generatoren zijn bedreven in hun respectievelijke vakgebieden, waarbij Dall-E 3 uitblinkt in tekst- en Midjourney excelleren in fotorealisme.
De fysica en geometrie van haardrogers zijn moeilijk Midjourney. Je kunt veel tijd besteden aan het worstelen met pogingen en referenties, en af en toe lijken de resultaten op een föhn, maar Dall-E 3 produceerde bij de eerste poging een acceptabel resultaat en schreef zelfs de tekst.
Het enige oog is goed, maar dat is een ander verhaal. In Midjourneyschreven we een negatieve prompt – geen cartoon, illustratie, plat, twee ogen. Dall-E 3 gehoorzaamde onmiddellijk en maakte één oog, een glimlach en een hoed af, maar weigerde botweg iemand een foto van haar te laten maken.
Midjourney zorgde ervoor dat de generatie niet op Brad leek, dus maakten we gebruik van de extra service Insight Face Swap om Brads gezicht op de generatie te plaatsen; hier stond een bericht over. Dall-E 3 weet wie Brad Pitt is en kan sterren tekenen zonder extra software.
Beide meshes zijn goed, maar Dall-E 3 kan ondertussen eenhoornhoorns maken Midjourney doorgaans niet.
Dall-E 3 heeft de personages goed in actie gebracht; we kunnen een orc en een elf met elfenoren zien. Er is ook iemand die een Nike-trainingspak draagt, maar zijn ogen zijn vlekkerig. De elfenpuntige oren worden meestal genegeerd Midjourney, en ook Nike wordt buiten beschouwing gelaten.
Toen het postscript “illustratie” aanvankelijk uit de prompt werd weggelaten, creëerde Dall-E 3 er een. We hebben toen besloten om het te vergelijken met Midjourney's illustratie. Terwijl Midjourney meer leek op illustraties uit het Sovjettijdperk en de sprookjesvleugels niet bevatte, deed Dall-E 3 fantastisch werk door de hamer en sikkel te tekenen. Het voorbeeld rechts laat zien hoe Dall-E 3 er in de tekst uit zou kunnen zien.
Echter, Midjourney ging in het fotorealisme; er is geen hoofdpersoon in de beelden, alleen de omgeving, maar toch gaaf. Dall-E 3 wilde niet meer op de foto.
Dall-E 3 vs. Midjourney: Voors en tegens
Terwijl gebruikers deze technologie verkennen, zijn er verschillende opmerkelijke sterke punten en beperkingen aan het licht gekomen, waardoor er meer inzicht ontstaat in de functionaliteit ervan.
Voors:
- Snelle gehoorzaamheid: Een van de opvallende kenmerken van Dall-E 3 is het opmerkelijke vermogen om aanwijzingen nauwkeurig op te volgen. Gebruikers hebben gemeld dat het AI-model effectief reageert op een breed scala aan input, waardoor het een veelzijdig hulpmiddel is voor verschillende taken.
- Veelzijdige creativiteit: Dall-E 3 beschikt over de mogelijkheid om meerdere karakters binnen één beeld weer te geven, waardoor de mogelijkheden voor het vertellen van verhalen en creatieve projecten worden vergroot. Deze veelzijdige aanpak vergroot de bruikbaarheid ervan in verschillende domeinen.
- Tekstintegratie: Gebruikers hebben de vaardigheid van Dall-E 3 opgemerkt in het naadloos integreren van tekst in afbeeldingen. Deze functie vergemakkelijkt het creëren van visueel aantrekkelijke inhoud met ingebedde tekstelementen.
nadelen:
- Beeldhelderheid: Een opmerkelijke beperking is de neiging van de AI om beelden met wazige gezichten en ogen te produceren. Hoewel het uitblinkt in creativiteit, mist het soms de helderheid en precisie die te zien is in door mensen gegenereerde inhoud.
- Stijlconsistentie: Dall-E 3 repliceert niet consequent de stijlen van specifieke artiesten, wat een nadeel kan zijn voor degenen die op zoek zijn naar nauwkeurige artistieke emulatie.
- VPN-vereiste: Toegang tot Dall-E 3 vereist momenteel het gebruik van een VPN, wat voor sommige gebruikers toegankelijkheidsproblemen kan opleveren.
- Beeldbeheer: Gebruikers zijn beperkingen tegengekomen bij het beheren van gegenereerde afbeeldingen op de Microsoft Bing-website. Er is met name geen functie voor formaatoriëntatie en de beeldgeschiedenis is beperkt tot recente uploads, waardoor onmiddellijk kopiëren voor later gebruik noodzakelijk is.
- Generatiesnelheid: In sommige gevallen is gemeld dat het generatieproces in Dall-E 3 langzamer verloopt in vergelijking met andere AI-modellen.
Ondanks deze beperkingen is Dall-E 3 veelbelovend. Zowel gebruikers als experts erkennen het potentieel ervan om een revolutie teweeg te brengen in het creëren van inhoud en het vertellen van verhalen. Als OpenAI blijft zijn aanbod verfijnen en uitbreiden, er wordt verwacht dat de sterke punten van Dall-E 3 nog helderder zullen schijnen, waardoor het een waardevol hulpmiddel op verschillende gebieden wordt.
Veelgestelde vragen
Zowel Dall-E 3 als Midjourney hebben hun sterke en zwakke punten. Dall-E 3 is opmerkelijk gehoorzaam aan aanwijzingen en kan tekst naadloos in afbeeldingen integreren. Het levert echter soms beelden op met wazige gezichten en ogen en het is mogelijk dat de stijlen van specifieke artiesten niet consistent worden gerepliceerd. Aan de andere kant, Midjourney blinkt uit in fotorealisme, maar geeft mogelijk niet altijd de essentie van bepaalde aanwijzingen zo nauwkeurig weer als Dall-E 3.
Het artikel biedt tekst-naar-afbeelding-prompts, waarin de resultaten van zowel Dall-E 3 als Midjourney, en legt de verschillen tussen de twee kunstgeneratoren uit.
Beide AI-modellen hebben hun sterke en zwakke punten. In een prompt over een ruimtevaarder op Jupiter bijvoorbeeld: Midjourney presteerde iets beter dan Dall-E 3. In een andere prompt over Wonder Woman was Dall-E 3 echter nauwkeuriger in het weergeven van de essentie van de prompt.
- Snelle gehoorzaamheid: Dall-E 3 volgt nauwkeurig de aanwijzingen.
- Veelzijdige creativiteit: Het kan meerdere karakters in één afbeelding weergeven.
- Tekstintegratie: Dall-E 3 kan tekst naadloos in afbeeldingen integreren.
- Beeld duidelijkheid: Het levert soms beelden op met wazige gezichten en ogen.
- Stijlconsistentie: Dall-E 3 repliceert niet consequent de stijlen van specifieke artiesten.
- Afbeeldingsbeheer: Er zijn beperkingen bij het beheren van gegenereerde afbeeldingen op de Microsoft Bing-website.
- Generatiesnelheid: Het generatieproces van Dall-E 3 kan langzamer zijn in vergelijking met andere AI-modellen.
Disclaimer
In lijn met de Richtlijnen voor vertrouwensprojectenHoud er rekening mee dat de informatie op deze pagina niet bedoeld is en niet mag worden geïnterpreteerd als juridisch, fiscaal, beleggings-, financieel of enige andere vorm van advies. Het is belangrijk om alleen te beleggen wat u zich kunt veroorloven te verliezen en onafhankelijk financieel advies in te winnen als u twijfels heeft. Voor meer informatie raden wij u aan de algemene voorwaarden en de hulp- en ondersteuningspagina's van de uitgever of adverteerder te raadplegen. MetaversePost streeft naar nauwkeurige, onpartijdige berichtgeving, maar de marktomstandigheden kunnen zonder voorafgaande kennisgeving worden gewijzigd.
Over de auteur
Damir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.
Meer artikelenDamir is de teamleider, productmanager en redacteur bij Metaverse Post, met onderwerpen als AI/ML, AGI, LLM's, Metaverse en Web3-gerelateerde velden. Zijn artikelen trekken maandelijks een enorm publiek van meer dan een miljoen gebruikers. Hij blijkt een expert te zijn met 10 jaar ervaring in SEO en digitale marketing. Damir is genoemd in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto en andere publicaties. Hij reist als digitale nomade tussen de VAE, Turkije, Rusland en het GOS. Damir behaalde een bachelordiploma in natuurkunde, wat hem volgens hem de kritische denkvaardigheden heeft gegeven die nodig zijn om succesvol te zijn in het steeds veranderende landschap van internet.