Dall-E 3 vs. Midjourney: Didelis pažangiausių AI meno generatorių palyginimas
Prisijunkite prie mūsų šioje jaudinančioje kelionėje, kai tyrinėsime Dall-E 3 ir Midjourneysubtilybes, sudėtingumą ir neišnaudotą potencialą. Šiame straipsnyje išryškinami labiausiai intriguojantys palyginimai, pagrįsti AI entuziastės Atachkinos atliktais tyrimais; Jei norite sužinoti daugiau, spustelėkite ryšys.
Pro Patarimai |
---|
1. Atskleiskite 50 geriausių teksto į vaizdą raginimų AI meno generatoriams Midjourney ir DALL-E. |
2. Pažadinkite savo kūrybiškumą naudodami 20 geriausių AI teksto į vaizdą meno generatorių iš 2023. |
Šiame straipsnyje pateikiama teksto į vaizdą raginimas, vaizdas, kuriame rodomi Dall-E 3 ir rezultatai Midjourneyir jų skirtumų paaiškinimas meno generatoriai. Pradėkime.
Šiuo atveju abu neuroniniai tinklai puikiai veikė su Midjourney šiek tiek lenkia kitus.
Dall-E 3 čia atliko daug prastesnį darbą; ji gavo ryškias stilių spalvas, bet ne detalių aiškumą; fone pasirodė deformuoti kūnai, o veidai visai nesisekė.
Abi vietos pasirodė įdomios, tačiau Dall-E 3 dar kartą kovojo su veidais. Vietoj to jis pagamino pliušinį smėlio spalvos maišelį, kaip nurodyta raginime, ir Midjourney to nepaisė. Šiuo atveju Dall-E 3 buvo labai paklusnus vykdydamas raginimą.
Ir dar kartą, nors abu tinkleliai sukuria puikius koliažus, Dall-E 3 yra labiau ištikimas raginimui; jis pridėjo tik mūsų nurodytus herojus, negalėjo virsti juokdariu ir kirto kapitoną su Betmenu.
Midjourney sugebėjo derinti atitinkamus dviejų menininkų stilius iš raginimo, o Dall-E 3 tiesiog pridėjo daug judrių detalių ir ryškių spalvų fone.
Vėlgi, katės yra aukščiausios formos, o abu neuroniniai tinklai puikiai supranta filmavimo kameras. Tačiau „Dall-E 3“ nuotraukose netgi prideda grūdų.
Dall-E 3 sukūrė jauną Leonardo DiCaprio su šauniomis džemperio tekstūromis, pridėjo plėvelės grūdėtumo ir spalvų schemą ir labai šauniai atspindėjo rusiškos vasarnamio pojūtį. Midjourney buvo geras filmo spalvų atšvaitas, o DiCaprio suteikė jai brandesnę išvaizdą.
Nors ir tiek neuroniniai tinklai jei atidžiai įsižiūrėsite, mokate kurti koliažus, Midjourney iškraipo veidus ir kai kurias objektų formas, o Dall-E 3 yra tikslesnis pačių veikėjų egzekucijai – tai netgi pasirodė Chewbacca.
Kai priartinsite nuotraukas, pastebėsite, kad Dall-E 3 akys neryškios; Midjourney, kita vertus, yra nepriekaištinga. Dall-E 3 taip pat nurodė prekės ženklą; gyvatės ant galvų atrodo gyvesnės ir juda; Midjourney visada gulėdavo, o ne ant galvos.
Abu šaunūs, bet Midjourney atsižvelgė į menininko stilių ir kino kameros efektą, o Dall-E 3 nepaisė viso ilgio kadro ir į tai neatsižvelgė.
Taip pat nusprendėme išbandyti nuotrauką su fėjomis, tačiau Dall-E 3 atkakliai atsisakė bendradarbiauti. Midjourney neignoravo sparnų, nes buvo pridėta nuoroda su sparnais. Kai „Dall-E 3“ nufotografavo, buvo keletas intriguojančių galimybių, tačiau su amerikiete.
Midjourney atliko fantastišką darbą, tačiau norime atkreipti ypatingą dėmesį į tai, kaip Dall-E 3 sukūrė filmo efektus viršutiniame dešiniajame paveikslėlyje ir pridėjo savo baltą rašyseną; pasirodė puikiai.
Dall-E 3 sugebėjo dar kartą labai klusniai suvokti visus raginimo herojus viename paveikslėlyje. Midjourney labai stengėsi ir net priartėjo prie sėkmės.
Iš pirmo žvilgsnio atrodo, kad abu yra geri, bet atidžiau pažiūrėjus paaiškėja, kad Dall-E 3 trūksta fotorealistinio garso ir kad Midjourney su trenksmu tvarkė sujungimus šakėmis.
Abu generatoriai yra įgudę atitinkamose srityse, o „Dall-E 3“ puikiai išmano tekstą ir Midjourney pasižymintis fotorealizmu.
Plaukų džiovintuvų fizika ir geometrija yra sudėtinga Midjourney. Galite praleisti daug laiko kovodami su bandymais ir nuorodomis, o kartais rezultatai primena plaukų džiovintuvą, tačiau Dall-E 3 davė priimtiną rezultatą iš pirmo karto ir netgi parašė tekstą.
Vienintelė akis gera, bet tai jau kita istorija. Į Midjourney, parašėme neigiamą raginimą – jokio animacinio filmo, iliustracija, butas, dvi akys. Dall-E 3 tuoj pat pakluso ir privertė vieną akį, nusišypsoti ir nusiimti skrybėlę, bet kategoriškai atsisakė niekam leisti jos nufotografuoti.
Midjourney padarė karta nemėgstamą Brado, todėl pasinaudojome papildoma paslauga „Insight“. "Face Swap" parodyti Brado veidą kartai; čia buvo įrašas apie tai. Dall-E 3 žino, kas yra Bradas Pittas, ir gali piešti žvaigždes be jokios papildomos programinės įrangos.
Abu tinkleliai yra geri, tačiau Dall-E 3 gali sukurti vienaragio ragus Midjourney paprastai negali.
Dall-E 3 atliko gerą darbą, priversdamas veikėjus veikti; galime pamatyti orką ir elfą elfo ausimis. Taip pat yra žmogus, dėvintis „Nike“ sportinį kostiumą, tačiau jo akys išteptos. Elfų smailias ausis dažniausiai ignoruoja Midjourney, o Nike taip pat nepaisoma.
Kai postscript „iliustracija“ iš pradžių nebuvo įtraukta į raginimą, Dall-E 3 ją sukūrė. Tada nusprendėme palyginti su Midjourneyiliustracija. Nors Midjourney labiau priminė sovietmečio iliustracijas ir be pasakų sparnų, Dall-E 3 puikiai nupiešė kūjį ir pjautuvą. Dešinėje pateiktame pavyzdyje parodyta, kaip Dall-E 3 gali pasirodyti tekste.
Tačiau, Midjourney nuėjo į fotorealizmą; vaizduose pagrindinio veikėjo nėra, tik aplinka, bet vis tiek šaunu. Dall-E 3 nenorėjo vėl būti nuotraukoje.
Dall-E 3 vs. Midjourney: Už ir prieš
Naudotojams tyrinėjant šią technologiją, išryškėjo keletas svarbių privalumų ir apribojimų, dėl kurių galima geriau suprasti jos funkcionalumą.
Argumentai "už":
- Greitas paklusnumas: Viena iš išskirtinių Dall-E 3 savybių yra jos nepaprastas gebėjimas tiksliai sekti nurodymus. Vartotojai pranešė, kad AI modelis efektyviai reaguoja į platų įvesties spektrą, todėl jis yra universalus įrankis įvairioms užduotims atlikti.
- Daugiapusis kūrybiškumas: Dall-E 3 turi galimybę pavaizduoti kelis personažus viename paveikslėlyje, išplečiant jo pasakojimo ir kūrybinių projektų galimybes. Šis daugialypis metodas padidina jo naudingumą įvairiose srityse.
- Teksto integravimas: Vartotojai pastebėjo „Dall-E 3“ įgūdžius sklandžiai integruoti tekstą į vaizdus. Ši funkcija palengvina vizualiai patrauklaus turinio su įterptais tekstiniais elementais kūrimą.
Trūkumai:
- Vaizdo aiškumas: Svarbus apribojimas yra AI tendencija kurti vaizdus su neryškiais veidais ir akimis. Nors jis išsiskiria kūrybiškumu, kartais jam trūksta aiškumo ir tikslumo, matomo žmogaus sukurtame turinyje.
- Stiliaus nuoseklumas: Dall-E 3 nenuosekliai atkartoja konkrečių menininkų stilių, kuris gali būti trūkumas ieškantiems tikslios meninės emuliacijos.
- VPN reikalavimas: Norint pasiekti Dall-E 3, šiuo metu reikia naudoti VPN, todėl kai kuriems vartotojams gali kilti sunkumų.
- Vaizdo valdymas: Vartotojai susidūrė su apribojimais tvarkydami sugeneruotus vaizdus „Microsoft Bing“ svetainėje. Pažymėtina, kad nėra formato orientavimo funkcijos, o vaizdų istorija apsiriboja naujausiais įkėlimais, todėl vėlesniam naudojimui reikia nedelsiant nukopijuoti.
- Kartos greitis: Kai kuriais atvejais buvo pranešta, kad Dall-E 3 generavimo procesas yra lėtesnis, palyginti su kitais AI modeliais.
Nepaisant šių apribojimų, Dall-E 3 žada daug. Naudotojai ir ekspertai pripažįsta jos potencialą pakeisti turinio kūrimą ir pasakojimą. Kaip OpenAI ir toliau tobulina ir plečia savo pasiūlymus, tikimasi, kad „Dall-E 3“ pranašumai dar labiau išryškės, todėl jis bus vertingas įrankis įvairiose srityse.
DUK
Tiek Dall-E 3, tiek Midjourney turi savo stipriąsias ir silpnąsias puses. Dall-E 3 yra ypač paklusnus raginimams ir gali sklandžiai integruoti tekstą į vaizdus. Tačiau kartais sukuriami vaizdai su neryškiais veidais ir akimis ir gali nenuosekliai atkartoti konkrečių menininkų stilių. Iš kitos pusės, Midjourney pasižymi fotorealizmu, bet ne visada gali taip tiksliai užfiksuoti tam tikrų raginimų esmę, kaip Dall-E 3.
Straipsnyje pateikiami teksto į vaizdą raginimai, kuriuose pateikiami tiek Dall-E 3, tiek Midjourneyir paaiškina dviejų meno generatorių skirtumus.
Abu AI modeliai turi savo stipriąsias ir silpnąsias puses. Pavyzdžiui, raginime apie kosmosą Jupiteryje, Midjourney šiek tiek pralenkė Dall-E 3. Tačiau kitame raginime apie Wonder Woman Dall-E 3 tiksliau užfiksavo raginimo esmę.
- Greitas paklusnumas: Dall-E 3 tiksliai laikosi nurodymų.
- Daugiapusis kūrybiškumas: viename paveikslėlyje gali būti pavaizduoti keli simboliai.
- Teksto integravimas: Dall-E 3 gali sklandžiai integruoti tekstą į vaizdus.
- Vaizdo aiškumas: kartais sukuriami vaizdai su neryškiais veidais ir akimis.
- Stiliaus nuoseklumas: Dall-E 3 nenuosekliai atkartoja konkrečių menininkų stilių.
- Vaizdų valdymas: yra apribojimų tvarkant sugeneruotus vaizdus „Microsoft Bing“ svetainėje.
- Kartos greitis: Dall-E 3 generavimo procesas gali būti lėtesnis, palyginti su kitais AI modeliais.
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.
Daugiau straipsniųDamiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže.