AI Wiki Menas Technologija
Spalis 02, 2023

Dall-E 3 vs. Midjourney: Didelis pažangiausių AI meno generatorių palyginimas

Prisijunkite prie mūsų šioje jaudinančioje kelionėje, kai tyrinėsime Dall-E 3 ir Midjourneysubtilybes, sudėtingumą ir neišnaudotą potencialą. Šiame straipsnyje išryškinami labiausiai intriguojantys palyginimai, pagrįsti AI entuziastės Atachkinos atliktais tyrimais; Jei norite sužinoti daugiau, spustelėkite ryšys.

Dall-E 3 vs. Midjourney: Didelis pažangiausių AI meno generatorių palyginimas
Pro Patarimai
1. Atskleiskite 50 geriausių teksto į vaizdą raginimų AI meno generatoriams Midjourney ir DALL-E.
2. Pažadinkite savo kūrybiškumą naudodami 20 geriausių AI teksto į vaizdą meno generatorių iš 2023.

Šiame straipsnyje pateikiama teksto į vaizdą raginimas, vaizdas, kuriame rodomi Dall-E 3 ir rezultatai Midjourneyir jų skirtumų paaiškinimas meno generatoriai. Pradėkime.

raginimas: Kosmininkas stovi ant Jupiterio ir stebi saulėtekį. futuristinė sąsaja, pirmojo asmens perspektyva, erdvės vadas, lietaus matuoklis ir HUD Rise vartotojo sąsaja

Šiuo atveju abu neuroniniai tinklai puikiai veikė su Midjourney šiek tiek lenkia kitus.

raginimas: Slim Aarons iš „Wonder Woman“ nufotografavo kambaryje, sudėtingi sluoksniai ir faktūros, detalus personažų dizainas, fonas su ryškiomis, įnoringomis ir spalvingomis scenomis, pastelinių spalvų korekcija, kaip Weso Andersono filmuose, filmo grūdėtumas ir Tokina AT-X 11–16 mm f /2.8 pro dx ii

Dall-E 3 čia atliko daug prastesnį darbą; ji gavo ryškias stilių spalvas, bet ne detalių aiškumą; fone pasirodė deformuoti kūnai, o veidai visai nesisekė.

raginimas: mielo, apkūnaus kibernetinės vaikiškos lovelės nuotrauka jo internetinėje rezidencijoje
raginimas: profesionali komercinė studija Nike; modelis ilgais plaukais; viso kūno šūvis; dėvėti smėlio spalvos Nike marškinėlius; neįprasta Nike džinsinė striukė; minkštas smėlio spalvos pliušinis Nike krepšys; minkšti violetiniai nike sportbačiai; stovi šviesiai rausvame-mėlyname fone; futuristinis sudėtingos supaprastintos formos fonas su foniniu apšvietimu; nušautas Hasselblad X1D;

Abi vietos pasirodė įdomios, tačiau Dall-E 3 dar kartą kovojo su veidais. Vietoj to jis pagamino pliušinį smėlio spalvos maišelį, kaip nurodyta raginime, ir Midjourney to nepaisė. Šiuo atveju Dall-E 3 buvo labai paklusnus vykdydamas raginimą.

raginimas: spindulių atsekta pastelinių spalvų burbulų figūra, moteriška skulptūra su metalo apdaila, blizgi / blizgi, ryški turbulencija, balandis, netradicinės pozos, anamorfinis menas, vaivorykštė / opalescencija, vaizdo grįžtamojo ryšio kilpos, blizgios akys, ryškūs kreivės, blizgus, figūratizmas
raginimas: senovinis retro koliažas iš superherojų, įskaitant „Wonder Woman“, „Captain America“, „Betman“ ir „The Joker“

Ir dar kartą, nors abu tinkleliai sukuria puikius koliažus, Dall-E 3 yra labiau ištikimas raginimui; jis pridėjo tik mūsų nurodytus herojus, negalėjo virsti juokdariu ir kirto kapitoną su Betmenu.

raginimas: metalo spindulių sekimo dėmė, anamorfinis menas, akį traukiančios detalės, tikslios linijos, ryškios kreivės, blizgus, sklandus figūratizmas, pastelinės spalvos, tamsus fonas
raginimas: paprasti sluoksniai ir tekstūros, sudėtingas personažų dizainas, ryškus, įnoringas ir spalvingas fonas, pastelinių spalvų korekcija Weso Andersono filmuose, juostos grūdeliai ir Tokina at-x 11–16 mm f/2.8 pro dx ii objektyvas. Šiame Slim Aarons nufotografuotame Žmogaus-voro, atsipalaiduojančio ant sofos, atvaizde.

Midjourney sugebėjo derinti atitinkamus dviejų menininkų stilius iš raginimo, o Dall-E 3 tiesiog pridėjo daug judrių detalių ir ryškių spalvų fone.

raginimas: 80-ojo dešimtmečio nuotrauka, kurioje apkūnios mielos storos katės dalyvauja aerobikos pamokoje ir dėvi linksmus leopardo antblauzdžius ir rožinius bodžius, buvo padaryta „Kodak Gold 200“.

Vėlgi, katės yra aukščiausios formos, o abu neuroniniai tinklai puikiai supranta filmavimo kameras. Tačiau „Dall-E 3“ nuotraukose netgi prideda grūdų.

Dešimtajame dešimtmetyje Leonardo DiCaprio vaidina Jedi meistrą Rusijos vasarnamyje, mojuodamas šviesos kardu ir vilkėdamas megztą žalią megztinį.

Dall-E 3 sukūrė jauną Leonardo DiCaprio su šauniomis džemperio tekstūromis, pridėjo plėvelės grūdėtumo ir spalvų schemą ir labai šauniai atspindėjo rusiškos vasarnamio pojūtį. Midjourney buvo geras filmo spalvų atšvaitas, o DiCaprio suteikė jai brandesnę išvaizdą.

raginimas: koliažas iš Žvaigždžių karai vintažinio retro stiliaus vaizdai

Nors ir tiek neuroniniai tinklai jei atidžiai įsižiūrėsite, mokate kurti koliažus, Midjourney iškraipo veidus ir kai kurias objektų formas, o Dall-E 3 yra tikslesnis pačių veikėjų egzekucijai – tai netgi pasirodė Chewbacca.

raginimas: nuotrauka, kurioje rusas gorgon medusa dėvi Balenciaga hypebeast gatvės drabužius ir vaikšto Manheteno gatve su gyvatėmis plaukams

Kai priartinsite nuotraukas, pastebėsite, kad Dall-E 3 akys neryškios; Midjourney, kita vertus, yra nepriekaištinga. Dall-E 3 taip pat nurodė prekės ženklą; gyvatės ant galvų atrodo gyvesnės ir juda; Midjourney visada gulėdavo, o ne ant galvos.

Raginimas: šioje apdovanojimus pelniusioje Slim Aarons nuotraukoje pavaizduotas žmogus-voras, persirengęs fėja, vilkintis rožine pūkuota suknele ir laikantis burtų lazdelę. Jis darytas su Fuji Superia X-TRA 800 kamera.

Abu šaunūs, bet Midjourney atsižvelgė į menininko stilių ir kino kameros efektą, o Dall-E 3 nepaisė viso ilgio kadro ir į tai neatsižvelgė.

raginimas: SSRS fėja su sparnais ir astronauto kostiumu

Taip pat nusprendėme išbandyti nuotrauką su fėjomis, tačiau Dall-E 3 atkakliai atsisakė bendradarbiauti. Midjourney neignoravo sparnų, nes buvo pridėta nuoroda su sparnais. Kai „Dall-E 3“ nufotografavo, buvo keletas intriguojančių galimybių, tačiau su amerikiete.

raginimas: sraigė, pozuojanti portretui vilkėdama šiuolaikinius hipsteriškus drabužius, 4K sudėtingus sluoksnius ir tekstūras, detalų personažų dizainą ir filmo grūdelius. Fone yra ryškios, įnoringos ir spalvingos scenos.

Midjourney atliko fantastišką darbą, tačiau norime atkreipti ypatingą dėmesį į tai, kaip Dall-E 3 sukūrė filmo efektus viršutiniame dešiniajame paveikslėlyje ir pridėjo savo baltą rašyseną; pasirodė puikiai.

raginimas: Žmogus-voras, Betmenas ir Geležinis žmogus susirinko išgerti alaus bare.

Dall-E 3 sugebėjo dar kartą labai klusniai suvokti visus raginimo herojus viename paveikslėlyje. Midjourney labai stengėsi ir net priartėjo prie sėkmės.

Raginimas: vasarinės pomidorų ir agurkų salotos, makro, pilna scena, šiltos spalvos, aukštos kokybės fotorealistinis hiperrealizmas, natūralus apšvietimas, Unreal Engine 5, spalvų klasifikavimas, redakcinė fotografija, fotografija, fotosesija, aukštas, epinis, artgerm, nufotografuotas su 70 mm objektyvu, lauko gylis, DOF, pakreiptas suliejimas, užrakto greitis 1/1000, F/22, baltos spalvos balansas, 32k, itin didelė raiška

Iš pirmo žvilgsnio atrodo, kad abu yra geri, bet atidžiau pažiūrėjus paaiškėja, kad Dall-E 3 trūksta fotorealistinio garso ir kad Midjourney su trenksmu tvarkė sujungimus šakėmis.

raginimas: „McDonald's“ vaizduotės erdvės peizažai su tikroviškomis žmonių figūromis, dviem automobiliais ir traktoriumi su mėnuliu. Les Nasbis, Pierre'as Pellegrini, moksliškai pagrįstas, novatoriškas drąsus sodrumas, ugnies branduolys

Abu generatoriai yra įgudę atitinkamose srityse, o „Dall-E 3“ puikiai išmano tekstą ir Midjourney pasižymintis fotorealizmu.

Plaukų džiovintuvas BaByliss D570DE naudojamas moderniame interjere su vakariniu apšvietimu, pramoniniu dizainu ir pastelinėmis spalvomis, puikiai tinka studijoms.

Plaukų džiovintuvų fizika ir geometrija yra sudėtinga Midjourney. Galite praleisti daug laiko kovodami su bandymais ir nuorodomis, o kartais rezultatai primena plaukų džiovintuvą, tačiau Dall-E 3 davė priimtiną rezultatą iš pirmo karto ir netgi parašė tekstą.

raginimas: vienaakės Turangos Leelos nuotrauka iš futuramos

Vienintelė akis gera, bet tai jau kita istorija. Į Midjourney, parašėme neigiamą raginimą – jokio animacinio filmo, iliustracija, butas, dvi akys. Dall-E 3 tuoj pat pakluso ir privertė vieną akį, nusišypsoti ir nusiimti skrybėlę, bet kategoriškai atsisakė niekam leisti jos nufotografuoti.

Aktorius Bradas Pittas 1990-aisiais laisto daržo lysves rusiškoje vasarnamyje, vilkėdamas dryžuotus apatinius ir sportines kelnes iš „Adidas“. Scena buvo užfiksuota „Agfa Vista 400“.

Midjourney padarė karta nemėgstamą Brado, todėl pasinaudojome papildoma paslauga „Insight“. "Face Swap" parodyti Brado veidą kartai; čia buvo įrašas apie tai. Dall-E 3 žino, kas yra Bradas Pittas, ir gali piešti žvaigždes be jokios papildomos programinės įrangos.

raginimas: graži mergina, vienaragiai, obuolių technologijos ir senovinis galaktikų retro koliažas

Abu tinkleliai yra geri, tačiau Dall-E 3 gali sukurti vienaragio ragus Midjourney paprastai negali.

raginimas: ledai rankoje, nike sportinė apranga ir stulbinantis fantastinis elfas, sėdintis šalia orko gatvės nuotraukoje.

Dall-E 3 atliko gerą darbą, priversdamas veikėjus veikti; galime pamatyti orką ir elfą elfo ausimis. Taip pat yra žmogus, dėvintis „Nike“ sportinį kostiumą, tačiau jo akys išteptos. Elfų smailias ausis dažniausiai ignoruoja Midjourney, o Nike taip pat nepaisoma.

raginimas: SSRS fėjos, apsirengusios astronautu, piešinys

Kai postscript „iliustracija“ iš pradžių nebuvo įtraukta į raginimą, Dall-E 3 ją sukūrė. Tada nusprendėme palyginti su Midjourneyiliustracija. Nors Midjourney labiau priminė sovietmečio iliustracijas ir be pasakų sparnų, Dall-E 3 puikiai nupiešė kūjį ir pjautuvą. Dešinėje pateiktame pavyzdyje parodyta, kaip Dall-E 3 gali pasirodyti tekste.

raginimas: vasarnamis ant Jupiterio, planetos orbitos žiedai matomi tolumoje, ateivis kepa šašlykinę, įmantrūs personažų dizainai, ryškūs, šmaikštūs ir spalvingi fonai, pastelinių spalvų korekcija Weso Andersono filmuose, juostos grūdeliai ir Tokina AT -X 11–16 mm f/2.8 Pro dX II objektyvas

Tačiau, Midjourney nuėjo į fotorealizmą; vaizduose pagrindinio veikėjo nėra, tik aplinka, bet vis tiek šaunu. Dall-E 3 nenorėjo vėl būti nuotraukoje.

raginimas: plėvelės grūdeliai, šunų maistas, sudėtingas personažų dizainas, sluoksniai ir tekstūros, ryškios, keistos ir spalvingos scenos fone ir pastelinių spalvų korekcija kaip Weso Andersono filme

Dall-E 3 vs. Midjourney: Už ir prieš

Naudotojams tyrinėjant šią technologiją, išryškėjo keletas svarbių privalumų ir apribojimų, dėl kurių galima geriau suprasti jos funkcionalumą.

Argumentai "už":

  1. Greitas paklusnumas: Viena iš išskirtinių Dall-E 3 savybių yra jos nepaprastas gebėjimas tiksliai sekti nurodymus. Vartotojai pranešė, kad AI modelis efektyviai reaguoja į platų įvesties spektrą, todėl jis yra universalus įrankis įvairioms užduotims atlikti.
  2. Daugiapusis kūrybiškumas: Dall-E 3 turi galimybę pavaizduoti kelis personažus viename paveikslėlyje, išplečiant jo pasakojimo ir kūrybinių projektų galimybes. Šis daugialypis metodas padidina jo naudingumą įvairiose srityse.
  3. Teksto integravimas: Vartotojai pastebėjo „Dall-E 3“ įgūdžius sklandžiai integruoti tekstą į vaizdus. Ši funkcija palengvina vizualiai patrauklaus turinio su įterptais tekstiniais elementais kūrimą.

Trūkumai:

  1. Vaizdo aiškumas: Svarbus apribojimas yra AI tendencija kurti vaizdus su neryškiais veidais ir akimis. Nors jis išsiskiria kūrybiškumu, kartais jam trūksta aiškumo ir tikslumo, matomo žmogaus sukurtame turinyje.
  2. Stiliaus nuoseklumas: Dall-E 3 nenuosekliai atkartoja konkrečių menininkų stilių, kuris gali būti trūkumas ieškantiems tikslios meninės emuliacijos.
  3. VPN reikalavimas: Norint pasiekti Dall-E 3, šiuo metu reikia naudoti VPN, todėl kai kuriems vartotojams gali kilti sunkumų.
  4. Vaizdo valdymas: Vartotojai susidūrė su apribojimais tvarkydami sugeneruotus vaizdus „Microsoft Bing“ svetainėje. Pažymėtina, kad nėra formato orientavimo funkcijos, o vaizdų istorija apsiriboja naujausiais įkėlimais, todėl vėlesniam naudojimui reikia nedelsiant nukopijuoti.
  5. Kartos greitis: Kai kuriais atvejais buvo pranešta, kad Dall-E 3 generavimo procesas yra lėtesnis, palyginti su kitais AI modeliais.

Nepaisant šių apribojimų, Dall-E 3 žada daug. Naudotojai ir ekspertai pripažįsta jos potencialą pakeisti turinio kūrimą ir pasakojimą. Kaip OpenAI ir toliau tobulina ir plečia savo pasiūlymus, tikimasi, kad „Dall-E 3“ pranašumai dar labiau išryškės, todėl jis bus vertingas įrankis įvairiose srityse.

DUK

Tiek Dall-E 3, tiek Midjourney turi savo stipriąsias ir silpnąsias puses. Dall-E 3 yra ypač paklusnus raginimams ir gali sklandžiai integruoti tekstą į vaizdus. Tačiau kartais sukuriami vaizdai su neryškiais veidais ir akimis ir gali nenuosekliai atkartoti konkrečių menininkų stilių. Iš kitos pusės, Midjourney pasižymi fotorealizmu, bet ne visada gali taip tiksliai užfiksuoti tam tikrų raginimų esmę, kaip Dall-E 3.

Straipsnyje pateikiami teksto į vaizdą raginimai, kuriuose pateikiami tiek Dall-E 3, tiek Midjourneyir paaiškina dviejų meno generatorių skirtumus.

Abu AI modeliai turi savo stipriąsias ir silpnąsias puses. Pavyzdžiui, raginime apie kosmosą Jupiteryje, Midjourney šiek tiek pralenkė Dall-E 3. Tačiau kitame raginime apie Wonder Woman Dall-E 3 tiksliau užfiksavo raginimo esmę.

  • Greitas paklusnumas: Dall-E 3 tiksliai laikosi nurodymų.
  • Daugiapusis kūrybiškumas: viename paveikslėlyje gali būti pavaizduoti keli simboliai.
  • Teksto integravimas: Dall-E 3 gali sklandžiai integruoti tekstą į vaizdus.
  • Vaizdo aiškumas: kartais sukuriami vaizdai su neryškiais veidais ir akimis.
  • Stiliaus nuoseklumas: Dall-E 3 nenuosekliai atkartoja konkrečių menininkų stilių.
  • Vaizdų valdymas: yra apribojimų tvarkant sugeneruotus vaizdus „Microsoft Bing“ svetainėje.
  • Kartos greitis: Dall-E 3 generavimo procesas gali būti lėtesnis, palyginti su kitais AI modeliais.

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Hot Stories
Prisijunkite prie mūsų naujienlaiškio.
Paskutinės naujienos

Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo

13F paraiškų atskleidimas atskleidžia žymius institucinius investuotojus, kurie naudojasi Bitcoin ETF, o tai rodo, kad vis labiau pritariama...

Žinoti daugiau

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
„Radiant Capital“ inicijuoja RFP-34 pasiūlymą, siūlo „weETH“ įtraukti į „Ethereum“ ir „Arbitrum“ diegimą
Naujienų ataskaita Technologija
„Radiant Capital“ inicijuoja RFP-34 pasiūlymą, siūlo „weETH“ įtraukti į „Ethereum“ ir „Arbitrum“ diegimą
Gali 7, 2024
„Crypto Exchange Binance“ pradės naujas prekybos poras ir įgalins prekybos robotus gegužės 8 d
rinkos Naujienų ataskaita Technologija
„Crypto Exchange Binance“ pradės naujas prekybos poras ir įgalins prekybos robotus gegužės 8 d
Gali 7, 2024
„Stacks“, „Moonriver Network“, „Hedera“ ir „Iron Fish“ dalyvaus Axelar „Interchain“ stiprintuvų programoje
Naujienų ataskaita Technologija
„Stacks“, „Moonriver Network“, „Hedera“ ir „Iron Fish“ dalyvaus Axelar „Interchain“ stiprintuvų programoje
Gali 7, 2024
„Tesla“ naudoja „Dogecoin“: didelis „Meme“ monetos pastiprinimas, nes ji tampa mokėjimo galimybe „Tesla“ internetinėje parduotuvėje
rinkos Istorijos ir apžvalgos Technologija
„Tesla“ naudoja „Dogecoin“: didelis „Meme“ monetos pastiprinimas, nes ji tampa mokėjimo galimybe „Tesla“ internetinėje parduotuvėje
Gali 7, 2024
CRYPTOMERIA LABS PTE. LTD.