AI Wiki Umjetnost Tehnologija
Listopada 02, 2023

Dall-E 3 vs. Midjourney: Velika usporedba najnaprednijih AI umjetničkih generatora

Pridružite nam se na ovom uzbudljivom putovanju dok istražujemo Dall-E 3 i Midjourneysuptilnosti, složenosti i neiskorištenog potencijala. Ovaj članak ističe najintrigantnije usporedbe temeljene na istraživanju koje je proveo AI entuzijast Atachkina; ako ste zainteresirani za više informacija, kliknite na link.

Dall-E 3 vs. Midjourney: Velika usporedba najnaprednijih AI umjetničkih generatora
Pro Savjeti
1. Otkrijte Top 50 upita za pretvaranje teksta u sliku za AI Art Generators Midjourney i DALL-E.
2. Zapalite svoju kreativnost s 20 najboljih AI umjetničkih generatora teksta u sliku od 2023.

Ovaj članak pruža upit za pretvaranje teksta u sliku, sliku koja prikazuje rezultate iz Dall-E 3 i Midjourney, te objašnjenje razlika između to dvoje generatori umjetnosti. Započnimo.

prompt: Svemirac stoji na Jupiteru i promatra izlazak sunca. futurističko sučelje, perspektiva iz prvog lica, svemirski zapovjednik, mjerač kiše i HUD Rise UI

Obje su se neuronske mreže u ovom slučaju izvrsno ponašale, s Midjourney malo nadmašujući ostale.

prompt: snimio Slim Aarons iz Wonder Woman u sobi, složeni slojevi i teksture, detaljan dizajn likova, pozadina sa svijetlim, otkačenim i šarenim scenama, pastelna korekcija boja poput filmova Wesa Andersona, zrnatost filma i Tokina AT-X 11-16 mm f /2.8 pro dx ii

Dall-E 3 je ovdje napravio puno lošiji posao; dobio je svijetle boje stilova, ali ne i jasnoću detalja; u pozadini su se pojavljivala deformirana tijela, a lica nisu bila nimalo uspješna.

prompt: slika slatkog, bucmastog cybercota u njegovoj online rezidenciji
prompt: profesionalna komercijalna studijska fotografija za Nike; model s dugom kosom; snimak cijelog tijela; nosi bež majicu Nike; neobična Nike traper jakna; nježno bež plišana nike torba; nježno ljubičaste nike tenisice; stoji na svijetloružičasto-plavoj pozadini; futuristička pozadina složenog aerodinamičnog oblika s pozadinskim osvjetljenjem; snimljeno na Hasselblad X1D;

Pokazalo se zanimljivo na oba mjesta, no Dall-E 3 se opet mučio s licima. Umjesto toga, napravio je plišanu bež torbu prema uputama u upitu i Midjourney zanemario to. U ovom slučaju, Dall-E 3 je bio vrlo poslušan u izvršavanju upita.

prompt: figura u obliku mjehurića u pastelnim bojama, ženska skulptura s metalik završnim obradama, sjajna/sjajna, živahna turbulencija, jezgra goluba, nekonvencionalne poze, anamorfna umjetnost, prelivanje/opalescencija, video povratne petlje, sjajne oči, hrabre krivulje, sjajni, fluidni figuratizam
prompt: vintage retro kolaž superheroja, uključujući Wonder Woman, Captain America, Batman i The Joker

I još jednom, dok obje mreže čine izvrsne kolaže, Dall-E 3 je vjerniji brzu; dodao je samo heroje koje smo naveli, nije se mogao pretvoriti u jokera, a prekrižio je kapetana s Batmanom.

brz: metalna mrlja s praćenjem zraka, anamorfna umjetnost, detalji koji privlače pažnju, precizne linije, oštre krivulje, sjajna, fluidna figuratizam, pastelne boje, tamna pozadina
prompt: jednostavni slojevi i teksture, zamršen dizajn likova, živopisne, otkačene i šarene pozadine, korekcija pastelnih boja kao u filmovima Wesa Andersona, zrnatost filma i objektiv Tokina at-x 11-16 mm f/2.8 pro dx ii su prisutni na ovoj slici Spider-Mana kako se opušta na sofi koju je snimio Slim Aarons.

Midjourney bio u mogućnosti kombinirati stilove dvaju umjetnika iz odziva, dok je Dall-E 3 samo dodao puno užurbanih detalja i svijetlih boja pozadini.

prompt: fotografija iz 80-ih bucmastih slatkih debelih mačaka koje sudjeluju u satu aerobika dok se nose u zabavnim leopard tajicama i ružičastim bodijima snimljena je na Kodak Gold 200.

Još jednom, mačke su u vrhunskoj formi, a obje neuronske mreže savršeno razumiju filmske kamere. Međutim, Dall-E 3 čak dodaje zrnatost slikama.

1990-ih, Leonardo DiCaprio glumi majstora Jedija na ruskoj dači dok rukuje svjetlosnim mačem i nosi pleteni zeleni džemper.

Dall-E 3 stvorio je mladog Leonarda DiCaprija s hladnim teksturama skakača, dodanom zrnatošću filma i shemom boja i vrlo hladno odražavao dojam ruske dače. Midjourney bila je dobar reflektor boje za film, a DiCaprio joj je dao zreliji izgled.

prompt: kolaž od Star Wars slike u vintage retro stilu

Iako su oboje neuronske mreže vješti su u stvaranju kolaža, ako bolje pogledate, Midjourney iskrivljuje lica i neke oblike predmeta, dok je Dall-E 3 točniji u izvedbi samih likova — čak se pokazalo da je Chewbacca.

prompt: slika ruske gorgone meduze koja nosi Balenciaga hypebeast uličnu odjeću i šeta ulicom na Manhattanu sa zmijama umjesto kose

Kada zumirate fotografije, primijetit ćete da Dall-E 3 ima zamagljene oči; Midjourney, s druge strane, besprijekoran. Dall-E 3 također je propisao marku; čini se da su zmije na glavama življe i u pokretu; Midjourney uvijek ih je činio ležeći, a ne na glavi.

Uputa: Ova nagrađivana fotografija Slima Aaronsa prikazuje čovjeka-pauka prerušenog u vilu koji nosi ružičastu lepršavu haljinu i drži čarobni štapić. Snimljeno je fotoaparatom Fuji Superia X-TRA 800.

Obje su cool, ali Midjourney uzeo u obzir umjetnikov stil kao i učinak filmske kamere, dok je Dall-E 3 ignorirao cjelovečernji snimak i nije ga uzeo u obzir.

prompt: SSSR vila s krilima i kostim astronauta

Odlučili smo i testirati fotografiju s vilama, no Dall-E 3 je tvrdoglavo odbio suradnju. Midjourney nije zanemario krila jer je dodana referenca s krilima. Kad je Dall-E 3 napravio fotografiju, ponudio je neke intrigantne mogućnosti, ali s Amerikankom.

prompt: puž koji pozira za portret dok nosi suvremenu hipstersku odjeću, 4K složeni slojevi i teksture, detaljan dizajn likova i zrnatost filma. Pozadina sadrži živopisne, otkačene i šarene scene.

Midjourney napravio fantastičan posao, ali želimo skrenuti posebnu pozornost na to kako je Dall-E 3 stvorio filmske efekte na gornjoj desnoj slici i dodao vlastiti bijeli rukopis; super je ispalo.

prompt: Spider-Man, Batman i Iron Man okupili su se na pivu u baru.

Dall-E 3 je još jednom uspio vrlo poslušno realizirati sve junake upita u jednoj slici. Midjourney jako se trudio i čak se približio uspjehu.

Prompt: Ljetna salata od rajčica i krastavaca, makro, puna scena, tople boje, visokokvalitetni fotorealistični hiperrealistični, prirodno osvjetljenje, Unreal Engine 5, gradacija boja, urednička fotografija, fotografija, foto snimanje, Tall, epic, artgerm, snimljeno objektivom od 70 mm, dubinska oštrina, DOF, zamućenje uz nagib, brzina zatvarača 1/1000, F/22, ravnoteža bijele boje, 32k, super rezolucija

Na prvi pogled, čini se da su obje dobre, ali detaljniji pregled otkriva da Dall-E 3 nema fotorealističan volumen i da Midjourney rukovao zglobovima vilicama uz prasak.

prompt: McDonald's u stilu maštovitih svemirskih pejzaža s realističnim ljudskim figurama, dva automobila i traktorom, iznad kojeg je mjesec. Les Nasbis, Pierre Pellegrini, znanstveno utemeljena, pionirska podebljana zasićenost, firecore

Oba generatora su vješti u svojim poljima, a Dall-E 3 briljira u tekstu i Midjourney ističući se fotorealizmom.

Sušilo za kosu BaByliss D570DE koristi se u modernom interijeru s večernjim osvjetljenjem, industrijskim dizajnom i pastelnim bojama, savršeno za studijsko snimanje.

Fizika i geometrija sušila za kosu su teški Midjourney. Možete potrošiti puno vremena mučeći se s pokušajima i referencama, a povremeno rezultati podsjećaju na fen, ali Dall-E 3 je u prvom pokušaju dao prihvatljiv rezultat i čak je napisao tekst.

prompt: fotografija jednooke Turange Leele iz futurame

Jedino oko je dobro, ali to je druga priča. U Midjourney, napisali smo negativan prompt – bez crtanog filma, ilustracija, stan, dva oka. Dall-E 3 je odmah poslušala i napravila jedno oko, osmijeh i šešir, ali je odlučno odbila dopustiti da je netko fotografira.

Glumac Brad Pitt viđen je 1990-ih kako zalijeva gredice u povrtnjaku na ruskoj dači dok nosi majicu na pruge i adidasove trenirke. Scena je snimljena na Agfa Vista 400.

Midjourney generacija nije bila poput Brada, pa smo koristili dodatnu uslugu Insight Zamjena lica staviti Bradovo lice na generaciju; bio je post o tome ovdje. Dall-E 3 zna tko je Brad Pitt i može crtati zvijezde bez dodatnog softvera.

prompt: lijepa djevojka, jednorozi, jabučne tehnologije i vintage retro kolaž galaksija

Obje mreže su dobre, ali Dall-E 3 može stvoriti rogove jednoroga Midjourney obično ne može.

prompt: sladoled u ruci, nike sportska odjeća i zapanjujući vilenjak iz mašte sjedi pokraj orka na uličnoj fotografiji.

Dall-E 3 je napravio dobar posao stavljanja likova u akciju; možemo vidjeti orka i vilenjaka s vilenjačkim ušima. Tu je i osoba koja nosi Nike trenirku, ali su joj oči zamrljane. Vilenjačke šiljate uši uglavnom se zanemaruju Midjourney, a Nike je također zanemaren.

prompt: crtež SSSR vile odjevene kao astronaut

Kad je postskriptum "ilustracija" prvotno izostavljen iz odzivnika, Dall-E 3 ju je stvorio. Zatim smo ga odlučili usporediti s Midjourneyilustracija. Dok Midjourney više nalikovao ilustracijama iz sovjetske ere i nije uključivao vilinska krila, Dall-E 3 napravio je fantastičan posao crtajući srp i čekić. Primjer s desne strane pokazuje kako se Dall-E 3 može pojaviti u tekstu.

prompt: dača na Jupiteru, orbitalni prstenovi planeta mogu se vidjeti u daljini, vanzemaljac kuha roštilj, zamršeni dizajn likova, svijetle, otkačene i šarene pozadine, korekcija pastelnih boja a la filmovi Wesa Andersona, zrnatost filma i Tokina AT -X 11-16mm f/2.8 Pro dX II objektiv

Međutim, Midjourney otišao u fotorealizam; nema glavnog lika na slikama, samo okolina, ali svejedno cool. Dall-E 3 više nije htio biti na fotografiji.

prompt: zrno filma, hrana za pse, zamršen dizajn likova, slojevi i teksture, svijetle, otkačene i šarene scene u pozadini i korekcija pastelnih boja kao u filmu Wesa Andersona

Dall-E 3 vs. Midjourney: Za i protiv

Kako korisnici istražuju ovu tehnologiju, na vidjelo je izašlo nekoliko značajnih prednosti i ograničenja, čime se dobiva daljnji uvid u njezinu funkcionalnost.

Pros:

  1. Brza poslušnost: Jedna od istaknutih značajki Dall-E 3 je njegova izvanredna sposobnost da točno prati upute. Korisnici su izvijestili da AI model učinkovito reagira na širok raspon unosa, što ga čini svestranim alatom za različite zadatke.
  2. Višestruka kreativnost: Dall-E 3 pokazuje sposobnost prikazivanja više likova unutar jedne slike, proširujući svoj potencijal za pripovijedanje priča i kreativne projekte. Ovaj višestrani pristup povećava njegovu korisnost u različitim domenama.
  3. Integracija teksta: Korisnici su primijetili sposobnost Dall-E 3 u besprijekornoj integraciji teksta u slike. Ova značajka olakšava stvaranje vizualno privlačnog sadržaja s ugrađenim tekstualnim elementima.

Cons:

  1. Jasnoća slike: Primjetno ograničenje je sklonost umjetne inteligencije da proizvodi slike sa zamućenim licima i očima. Iako se ističe u kreativnosti, ponekad mu nedostaje jasnoća i preciznost koja se vidi u sadržaju koji stvaraju ljudi.
  2. Dosljednost stila: Dall-E 3 ne ponavlja dosljedno stilove određenih umjetnika, što može biti nedostatak za one koji traže preciznu umjetničku emulaciju.
  3. Zahtjev za VPN: Pristup Dall-E 3 trenutno zahtijeva korištenje VPN-a, što može predstavljati izazove u pogledu pristupačnosti za neke korisnike.
  4. Upravljanje slikama: Korisnici su naišli na ograničenja pri upravljanju generiranim slikama na web stranici Microsoft Bing. Naime, ne postoji funkcija orijentacije formata, a povijest slika ograničena je na nedavne prijenose, što zahtijeva trenutno kopiranje za kasniju upotrebu.
  5. Brzina generiranja: U nekim je slučajevima prijavljeno da je proces generiranja u Dall-E 3 sporiji u usporedbi s drugim AI modelima.

Unatoč ovim ograničenjima, Dall-E 3 ima značajna obećanja. Korisnici i stručnjaci podjednako prepoznaju njegov potencijal da revolucionarizira stvaranje sadržaja i pripovijedanje. Kao OpenAI nastavlja usavršavati i širiti svoju ponudu, očekuje se da će prednosti Dall-E 3 zasjati još jače, čineći ga vrijednim alatom u raznim područjima.

PITANJA I ODGOVORI

I Dall-E 3 i Midjourney imaju svoje snage i slabosti. Dall-E 3 je osobito poslušan upitima i može besprijekorno integrirati tekst u slike. Međutim, ponekad proizvodi slike sa zamućenim licima i očima i možda neće dosljedno replicirati stilove određenih umjetnika. S druge strane, Midjourney briljira u fotorealizmu, ali možda neće uvijek uhvatiti bit određenih upita tako precizno kao Dall-E 3.

U članku se nalaze upute za pretvaranje teksta u sliku, prikazujući rezultate i Dall-E 3 i Midjourney, te objašnjava razlike između dva umjetnička generatora.

Oba AI modela imaju svoje snage i slabosti. Na primjer, u upitu o svemircu na Jupiteru, Midjourney malo je nadmašio Dall-E 3. Međutim, u drugom upitu o Wonder Woman, Dall-E 3 je bio točniji u hvatanju suštine upita.

  • Brza poslušnost: Dall-E 3 točno slijedi upute.
  • Višestruka kreativnost: Može prikazati više likova na jednoj slici.
  • Integracija teksta: Dall-E 3 može besprijekorno integrirati tekst u slike.
  • Jasnoća slike: Ponekad proizvodi slike sa zamućenim licima i očima.
  • Dosljednost stila: Dall-E 3 ne ponavlja dosljedno stilove određenih umjetnika.
  • Upravljanje slikama: Postoje ograničenja pri upravljanju generiranim slikama na web stranici Microsoft Bing.
  • Brzina generacije: Proces generiranja Dall-E 3 može biti sporiji u usporedbi s drugim AI modelima.

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Institucionalni apetit raste prema Bitcoin ETF-ovima usred volatilnosti

Objave putem 13F prijava otkrivaju značajne institucionalne ulagače koji se upuštaju u Bitcoin ETF-ove, naglašavajući sve veće prihvaćanje ...

Znati više

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Side Protocol pokreće Incentivized Testnet i uvodi Insider Point sustav, omogućujući korisnicima da zarade SIDE bodove
tržišta Vijesti Tehnologija
Side Protocol pokreće Incentivized Testnet i uvodi Insider Point sustav, omogućujući korisnicima da zarade SIDE bodove
Neka 9, 2024
Web3 i kripto događaji u svibnju 2024.: istraživanje novih tehnologija i novih trendova u blockchainu i DeFi
probaviti posao tržišta Tehnologija
Web3 i kripto događaji u svibnju 2024.: istraživanje novih tehnologija i novih trendova u blockchainu i DeFi
Neka 9, 2024
Notcoin će se lansirati na OKX Jumpstartu, nudi 1.25% ukupne ponude tokena za rudarenje
tržišta Vijesti Tehnologija
Notcoin će se lansirati na OKX Jumpstartu, nudi 1.25% ukupne ponude tokena za rudarenje
Neka 9, 2024
Puffer Finance pokreće svoju glavnu mrežu, poboljšava uključivanje operatera čvora za decentralizaciju mreže
Vijesti Tehnologija
Puffer Finance pokreće svoju glavnu mrežu, poboljšava uključivanje operatera čvora za decentralizaciju mreže
Neka 9, 2024
CRYPTOMERIA LABS PTE. LTD.