Dall-E 3 vs. Midjourney: Suuri vertailu edistyneimmistä tekoälytaidegeneraattoreista
Liity kanssamme tälle jännittävälle matkalle, kun tutkimme Dall-E 3:a ja Midjourneysen hienouksia, monimutkaisuutta ja hyödyntämätöntä potentiaalia. Tämä artikkeli korostaa kiehtovimmat vertailut, jotka perustuvat tekoälyn harrastaja Atachkinan tutkimukseen; Jos olet kiinnostunut oppimaan lisää, napsauta linkkiä.
Pro Vinkkejä |
---|
1. Avaa 50 parasta tekstistä kuvaksi -kehotetta AI Art Generatoreille Midjourney ja DALL-E. |
2. Sytytä luovuutesi 20 parasta tekoälyn tekstistä kuvaksi -taidegeneraattoria ja 2023. |
Tämä artikkeli sisältää tekstistä kuvaksi -kehotteen, kuvan, joka näyttää tulokset Dall-E 3:sta ja Midjourneyja selitys näiden kahden välisistä eroista taiteen generaattorit. Aloitetaanpa.
Molemmat hermoverkot suoriutuivat ihailtavasti tässä tapauksessa Midjourney hieman parempia kuin muut.
Dall-E 3 teki paljon huonompaa työtä täällä; se sai tyylien kirkkaat värit, mutta ei yksityiskohtien selkeyttä; Epämuodostuneet ruumiit ilmestyivät taustalle, eivätkä kasvot onnistuneet ollenkaan.
Se osoittautui mielenkiintoiseksi molemmista paikoista, mutta Dall-E 3 kamppaili jälleen kasvojen kanssa. Sen sijaan se teki muhkean beigen laukun kehotteen ohjeiden mukaisesti, ja Midjourney jättänyt sen huomioimatta. Tässä tapauksessa Dall-E 3 oli erittäin tottelevainen suorittaessaan kehotuksen.
Ja jälleen kerran, vaikka molemmat ruudukot tekevät erinomaisia kollaaseja, Dall-E 3 on uskollisempi kehotteeseen; se lisäsi vain määrittelemämme sankarit, se ei voinut muuttua jokeriksi, ja se ristesi kapteenin kanssa Batmanin kanssa.
Midjourney pystyi yhdistämään kahden taiteilijan vastaavat tyylit kehotuksesta, kun taas Dall-E 3 vain lisäsi taustalle paljon kiireisiä yksityiskohtia ja kirkkaita värejä.
Kissat ovat jälleen huippukunnossa, ja molemmat hermoverkot ymmärtävät filmikamerat täydellisesti. Dall-E 3 kuitenkin jopa lisää rakeita kuviin.
Dall-E 3 loi nuoren Leonardo DiCaprion viileillä neulekuvioilla, lisäsi kalvon rakeita ja värimaailmaa ja heijasti erittäin viileästi venäläisen dachan tunnelmaa. Midjourney oli hyvä väriheijastin elokuvaan, ja DiCaprio antoi hänelle kypsemmän ulkonäön.
Vaikka molemmat hermoverkkoihin olet taitava luomaan kollaaseja, jos katsot tarkkaan, Midjourney vääristää kasvoja ja joitain esineiden muotoja, kun taas Dall-E 3 on tarkempi itse hahmojen suorituksessa – se osoittautui jopa Chewbaccaksi.
Kun lähennät valokuvia, huomaat, että Dall-E 3:ssa on sumeat silmät; Midjourney, toisaalta, on virheetön. Dall-E 3 määräsi myös tuotemerkin; päissä olevat käärmeet näyttävät olevan elävämpiä ja liikkeessä; Midjourney sai heidät aina makuulle, eikä päähän.
Molemmat ovat siistejä, mutta Midjourney otti huomioon taiteilijan tyylin sekä filmikameran vaikutuksen, kun taas Dall-E 3 jätti huomiotta täyspitkän kuvan eikä huomioinut sitä.
Päätimme myös testata valokuvaa keijujen kanssa, mutta Dall-E 3 kieltäytyi itsepintaisesti yhteistyöstä. Midjourney ei jättänyt huomioimatta siipiä, koska viittaus siipillä oli lisätty. Kun Dall-E 3 otti kuvan, se tarjosi kiehtovia mahdollisuuksia, mutta amerikkalaisen naisen kanssa.
Midjourney teki loistavaa työtä, mutta haluamme kiinnittää erityistä huomiota siihen, kuinka Dall-E 3 loi elokuvatehosteet oikeaan yläkuvaan ja lisäsi oman valkoisen käsialan; siitä tuli hienoa.
Dall-E 3 pystyi hyvin kuuliaisesti toteuttamaan kaikki kehotteen sankarit yhdeksi kuvaksi vielä kerran. Midjourney yritti kovasti ja oli jopa lähellä onnistumista.
Ensi silmäyksellä vaikuttaa siltä, että molemmat ovat hyviä, mutta lähempi tarkastelu paljastaa, että Dall-E 3:sta puuttuu fotorealistinen äänenvoimakkuus ja että Midjourney käsitteli nivelet haarukoilla räjähdysmäisesti.
Molemmat generaattorit ovat taitavia omilla aloillaan, ja Dall-E 3 on erinomainen teksti- ja Midjourney loistaa fotorealismissa.
Hiustenkuivaajien fysiikka ja geometria ovat vaikeita Midjourney. Voit viettää paljon aikaa kokeilujen ja viitteiden kanssa kamppaillessa, ja toisinaan tulokset muistuttavat hiustenkuivaajaa, mutta Dall-E 3 tuotti hyväksyttävän tuloksen ensimmäisellä yrittämällä ja jopa kirjoitti tekstin.
Ainoa silmä on hyvä, mutta se on toinen tarina. Sisään Midjourney, kirjoitimme negatiivisen kehotteen – ei sarjakuvaa, kuvitus, litteä, kaksi silmää. Dall-E 3 totteli välittömästi ja sai toisen silmän, hymyn ja hatun pois, mutta se kieltäytyi jyrkästi antamasta kenenkään ottaa kuvaa.
Midjourney teki sukupolven ei pidä Bradista, joten käytimme lisäpalvelua Insight Face Swap tuoda Bradin kasvot sukupolvelle; siitä oli postaus täällä. Dall-E 3 tietää kuka Brad Pitt on ja osaa piirtää tähtiä ilman lisäohjelmistoja.
Molemmat verkot ovat hyviä, mutta Dall-E 3 voi luoda yksisarvissarvia samalla Midjourney tyypillisesti ei voi.
Dall-E 3 onnistui saattamaan hahmot toimintaan. voimme nähdä örkin ja tontun tonttukorvilla. Siellä on myös henkilö, jolla on yllään Niken verryttelypuku, mutta hänen silmänsä ovat tahraiset. Haltioiden teräväkärkiset korvat jäävät useimmiten huomiotta Midjourney, ja myös Nike jätetään huomiotta.
Kun jälkikirjoitus "kuva" jätettiin alun perin pois kehotuksesta, Dall-E 3 loi sellaisen. Päätimme sitten verrata sitä Midjourneyn kuva. Sillä aikaa Midjourney Muistutti enemmän Neuvostoliiton aikaisia piirroksia eikä sisältänyt keijun siipiä. Dall-E 3 piirsi vasaran ja sirpin upeasti. Oikealla oleva esimerkki näyttää, kuinka Dall-E 3 saattaa esiintyä tekstissä.
Kuitenkin, Midjourney meni fotorealismiin; kuvissa ei ole päähenkilöä, vain ympäristö, mutta silti siistiä. Dall-E 3 ei halunnut enää olla valokuvassa.
Dall-E 3 vs. Midjourney: Hyvät ja huonot puolet
Kun käyttäjät tutkivat tätä tekniikkaa, useita merkittäviä vahvuuksia ja rajoituksia on tullut ilmi, mikä on lisännyt näkemystä sen toimivuudesta.
Plussat:
- Nopea tottelevaisuus: Yksi Dall-E 3:n erottuvista ominaisuuksista on sen huomattava kyky seurata kehotteita tarkasti. Käyttäjät ovat raportoineet, että tekoälymalli reagoi tehokkaasti monenlaisiin syötteisiin, mikä tekee siitä monipuolisen työkalun erilaisiin tehtäviin.
- Monipuolinen luovuus: Dall-E 3:lla on kyky kuvata useita hahmoja yhdessä kuvassa, mikä laajentaa sen mahdollisuuksia tarinankerrontaan ja luoviin projekteihin. Tämä monipuolinen lähestymistapa parantaa sen hyödyllisyyttä eri aloilla.
- Tekstin integrointi: Käyttäjät ovat huomanneet Dall-E 3:n taidon integroida tekstiä saumattomasti kuviin. Tämä ominaisuus helpottaa visuaalisesti kiinnostavan sisällön luomista upotetuilla tekstielementeillä.
Miinukset:
- Kuvan selkeys: Merkittävä rajoitus on tekoälyn taipumus tuottaa kuvia, joissa kasvot ja silmät ovat epäselviä. Vaikka se loistaa luovuudessaan, siitä joskus puuttuu ihmisten luoman sisällön selkeys ja tarkkuus.
- Tyylin johdonmukaisuus: Dall-E 3 ei toista johdonmukaisesti tiettyjen taiteilijoiden tyylejä, mikä voi olla haitta niille, jotka etsivät tarkkaa taiteellista emulointia.
- VPN-vaatimus: Dall-E 3:n käyttö edellyttää tällä hetkellä VPN:n käyttöä, mikä voi aiheuttaa saavutettavuushaasteita joillekin käyttäjille.
- Kuvanhallinta: Käyttäjät ovat kohdanneet rajoituksia luotujen kuvien hallinnassa Microsoft Bing -sivustolla. Erityisesti siinä ei ole muotojen suuntaamistoimintoa, ja kuvahistoria on rajoitettu viimeaikaisiin latauksiin, mikä edellyttää välitöntä kopiointia myöhempää käyttöä varten.
- Sukupolven nopeus: Joissakin tapauksissa Dall-E 3:n tuotantoprosessin on raportoitu olevan hitaampi verrattuna muihin tekoälymalleihin.
Näistä rajoituksista huolimatta Dall-E 3:lla on huomattava lupaus. Sekä käyttäjät että asiantuntijat tunnustavat sen potentiaalin mullistaa sisällöntuotannon ja tarinankerronta. Kuten OpenAI jatkaa jalostaa ja laajentaa tarjontaansa, on odotettavissa, että Dall-E 3:n vahvuudet loistavat entistä kirkkaammin, mikä tekee siitä arvokkaan työkalun useilla aloilla.
UKK
Sekä Dall-E 3 että Midjourney on vahvuutensa ja heikkoutensa. Dall-E 3 on erityisen tottelevainen kehotuksiin ja voi integroida tekstiä saumattomasti kuviin. Joskus se kuitenkin tuottaa kuvia, joissa kasvot ja silmät ovat epäselviä, eikä se välttämättä toista jatkuvasti tiettyjen taiteilijoiden tyylejä. Toisaalta, Midjourney on erinomainen fotorealismissa, mutta ei välttämättä aina tallenna tiettyjen kehotteiden olemusta yhtä tarkasti kuin Dall-E 3.
Artikkeli sisältää tekstistä kuvaksi -kehotteita, jotka esittelevät tuloksia sekä Dall-E 3:sta että Midjourneyja selittää näiden kahden taidegeneraattorin väliset erot.
Molemmilla tekoälymalleilla on vahvuutensa ja heikkoutensa. Esimerkiksi kehotteessa Jupiterin avaruusmiehestä, Midjourney suoritti hieman Dall-E 3:n. Kuitenkin toisessa Wonder Womania koskevassa kehotteessa Dall-E 3 vangitsi kehotteen olemuksen tarkemmin.
- Välitön tottelevaisuus: Dall-E 3 noudattaa ohjeita tarkasti.
- Monipuolinen luovuus: Se voi kuvata useita merkkejä yhdessä kuvassa.
- Tekstin integrointi: Dall-E 3 voi integroida tekstiä saumattomasti kuviin.
- Kuvan selkeys: Joskus se tuottaa kuvia, joissa kasvot ja silmät ovat epäselviä.
- Tyylin johdonmukaisuus: Dall-E 3 ei toista johdonmukaisesti tiettyjen taiteilijoiden tyylejä.
- Kuvahallinta: Microsoft Bing -sivustolla luotujen kuvien hallinnassa on rajoituksia.
- Sukupolven nopeus: Dall-E 3:n sukupolviprosessi voi olla hitaampi verrattuna muihin tekoälymalleihin.
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.
lisää artikkeleitaDamir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa.