Dall-E 3 vs. Midjourney: velika primerjava najnaprednejših umetniških generatorjev z umetno inteligenco
Pridružite se nam na tem vznemirljivem potovanju, ko raziskujemo Dall-E 3 in Midjourneysubtilnosti, zapletenosti in neizkoriščenega potenciala. Ta članek izpostavlja najbolj zanimive primerjave na podlagi raziskave, ki jo je izvedla navdušenka AI Atachkina; če vas zanima več, kliknite povezava.
Pro Nasveti |
---|
1. Odkrijte 50 najbolj priljubljenih pozivov za pretvorbo besedila v sliko za AI Art Generators Midjourney in DALL-E. |
2. Razvnemite svojo ustvarjalnost z 20 najboljših AI umetniških generatorjev besedila v sliko 2023. |
Ta članek vsebuje poziv za pretvorbo besedila v sliko, sliko, ki prikazuje rezultate Dall-E 3 in Midjourney, in razlago razlik med obema generatorji umetnosti. Začnimo.
Obe nevronski mreži sta se v tem primeru obnesli čudovito, z Midjourney nekoliko prekaša druge.
Dall-E 3 je tukaj opravil precej slabše delo; dobil je svetle barve slogov, ne pa tudi jasnosti podrobnosti; v ozadju so se pojavila deformirana telesa, obrazi pa niso bili prav nič uspešni.
Obe strani se je izkazalo za zanimivo, vendar se je Dall-E 3 znova spopadel z obrazi. Namesto tega je izdelal plišasto bež vrečko, kot je bilo navedeno v pozivu, in Midjourney ni upošteval. V tem primeru je bil Dall-E 3 zelo poslušen pri izvajanju poziva.
In še enkrat, medtem ko sta obe mreži odlična kolaža, je Dall-E 3 bolj zvest pozivu; dodal je samo junake, ki smo jih določili, ni se mogel spremeniti v jokerja in prekrižal je kapitana z Batmanom.
Midjourney je lahko združil ustrezne sloge obeh umetnikov iz poziva, medtem ko je Dall-E 3 v ozadje samo dodal veliko živahnih podrobnosti in svetlih barv.
Tudi tokrat so mačke v vrhunski formi in obe nevronski mreži odlično razumeta filmske kamere. Vendar pa Dall-E 3 celo doda zrnatost slikam.
Dall-E 3 je ustvaril mladega Leonarda DiCapria s kul teksturami skakalcev, dodano filmsko zrnatostjo in barvno shemo ter zelo kul odseval občutek ruske dače. Midjourney je bila dober barvni odbojnik za film, DiCaprio pa ji je dal bolj zrel videz.
Čeprav oboje nevronske mreže so vešči ustvarjanja kolažev, če pogledate od blizu, Midjourney izkrivlja obraze in nekatere oblike predmetov, medtem ko je Dall-E 3 natančnejši pri izvedbi samih likov - izkazalo se je celo, da je Chewbacca.
Ko povečate fotografije, boste opazili, da ima Dall-E 3 zamegljene oči; Midjourney, po drugi strani pa je brezhiben. Dall-E 3 je predpisal tudi blagovno znamko; kače na glavah se zdijo bolj žive in v gibanju; Midjourney vedno jih je naredil leže, namesto na glavi.
Oboje je kul, ampak Midjourney upošteval umetnikov slog kot tudi učinek filmske kamere, medtem ko Dall-E 3 ni upošteval celovečernega posnetka in ga ni upošteval.
Odločili smo se tudi za test fotografije z vilami, vendar je Dall-E 3 vztrajno zavrnil sodelovanje. Midjourney ni prezrl kril, ker je bila dodana referenca s krili. Ko je Dall-E 3 posnel sliko, je ponudil nekaj zanimivih možnosti, vendar z Američanko.
Midjourney opravili fantastično delo, vendar želimo posebno pozornost opozoriti na to, kako je Dall-E 3 ustvaril filmske učinke na zgornji desni sliki in dodal lastno belo pisavo; izkazalo se je super.
Dall-E 3 je uspel zelo poslušno uresničiti vse junake poziva v eni sliki. Midjourney zelo trudila in se celo približala uspehu.
Na prvi pogled se zdi, da sta oba dobra, vendar natančnejši pregled razkrije, da Dall-E 3 nima fotorealistične glasnosti in da Midjourney s pokom obdelal sklepe z vilicami.
Oba generatorja sta vešča na svojih področjih, pri čemer je Dall-E 3 odličen v besedilu in Midjourney blesti v fotorealizmu.
Fizika in geometrija sušilnikov za lase sta težki Midjourney. Lahko porabite veliko časa, da se ubadate s poskusi in referencami, občasno pa rezultati spominjajo na fen, vendar je Dall-E 3 v prvem poskusu dal sprejemljiv rezultat in celo napisal besedilo.
Edino oko je dobro, a to je že druga zgodba. notri Midjourney, smo napisali negativni poziv – brez risanke, ilustracija, ravno, dve očesi. Dall-E 3 je takoj ubogal in naredil eno oko, nasmeh in dol, vendar je odločno zavrnil, da bi jo kdorkoli fotografiral.
Midjourney generacija ni bila podobna Bradu, zato smo uporabili dodatno storitev Insight Face Swap prikazati Bradov obraz generaciji; tukaj je bila objava o tem. Dall-E 3 ve, kdo je Brad Pitt in lahko nariše zvezde brez dodatne programske opreme.
Obe mreži sta dobri, vendar lahko Dall-E 3 ustvari rogove samoroga Midjourney običajno ne more.
Dall-E 3 je dobro udejanjil like; lahko vidimo orka in vilenjaka z vilinskimi ušesi. Obstaja tudi oseba, ki nosi trenirko Nike, vendar ima zamazane oči. Vilinska koničasta ušesa večinoma ignorirajo Midjourney, Nike pa je tudi zanemarjen.
Ko je bil postscript "ilustracija" sprva izpuščen iz poziva, jo je Dall-E 3 ustvaril. Nato smo se odločili, da ga primerjamo z Midjourneyilustracija. Medtem Midjourney bolj podoben ilustracijam iz sovjetskega obdobja in ni vključeval pravljičnih kril, je Dall-E 3 odlično opravil risanje srpa in kladiva. Primer na desni prikazuje, kako bi lahko Dall-E 3 izgledal v besedilu.
Vendar pa Midjourney šel v fotorealizem; na slikah ni glavnega junaka, samo okolica, a vseeno kul. Dall-E 3 ni več hotel biti na fotografiji.
Dall-E 3 vs. Midjourney: Prednosti in slabosti
Ko uporabniki raziskujejo to tehnologijo, je prišlo na dan več pomembnih prednosti in omejitev, kar daje nadaljnji vpogled v njeno funkcionalnost.
Prednosti:
- Takojšnja poslušnost: Ena od izstopajočih lastnosti Dall-E 3 je njegova izjemna sposobnost natančnega sledenja navodilom. Uporabniki so poročali, da se model AI učinkovito odziva na širok spekter vnosov, zaradi česar je vsestransko orodje za različne naloge.
- Večplastna ustvarjalnost: Dall-E 3 izkazuje zmožnost upodabljanja več likov znotraj ene slike, s čimer širi svoj potencial za pripovedovanje zgodb in ustvarjalne projekte. Ta večplastni pristop povečuje njegovo uporabnost na različnih področjih.
- Integracija besedila: Uporabniki so opazili spretnost Dall-E 3 pri brezhibnem vključevanju besedila v slike. Ta funkcija olajša ustvarjanje vizualno privlačne vsebine z vdelanimi besedilnimi elementi.
Slabosti:
- Jasnost slike: Pomembna omejitev je težnja umetne inteligence, da ustvari slike z zamegljenimi obrazi in očmi. Čeprav se odlikuje po ustvarjalnosti, mu včasih manjka jasnosti in natančnosti, ki ju vidimo pri vsebini, ki jo ustvari človek.
- Skladnost sloga: Dall-E 3 ne posnema dosledno stilov določenih umetnikov, kar je lahko pomanjkljivost za tiste, ki iščejo natančno umetniško posnemanje.
- Zahteva VPN: Dostop do Dall-E 3 trenutno zahteva uporabo VPN-ja, kar lahko nekaterim uporabnikom predstavlja izzive glede dostopnosti.
- Upravljanje slik: Uporabniki so naleteli na omejitve pri upravljanju ustvarjenih slik na spletnem mestu Microsoft Bing. Predvsem ni funkcije orientacije formata, zgodovina slik pa je omejena na nedavna nalaganja, kar zahteva takojšnje kopiranje za kasnejšo uporabo.
- Hitrost generiranja: V nekaterih primerih so poročali, da je proces generiranja v Dall-E 3 počasnejši v primerjavi z drugimi modeli AI.
Kljub tem omejitvam Dall-E 3 veliko obeta. Uporabniki in strokovnjaki priznavajo njen potencial za revolucijo pri ustvarjanju vsebin in pripovedovanju zgodb. Kot OpenAI še naprej izpopolnjuje in širi svojo ponudbo, se pričakuje, da bodo prednosti Dall-E 3 še bolj zasijale, zaradi česar bo postal dragoceno orodje na različnih področjih.
Pogosta vprašanja
Tako Dall-E 3 kot Midjourney imajo svoje prednosti in slabosti. Dall-E 3 je zlasti poslušen pozivom in lahko brezhibno integrira besedilo v slike. Vendar pa včasih ustvari slike z zamegljenimi obrazi in očmi in morda ne posnema dosledno stilov določenih umetnikov. Po drugi strani, Midjourney odlikuje ga fotorealizem, vendar morda ne zajame vedno bistva določenih pozivov tako natančno kot Dall-E 3.
Članek vsebuje pozive za pretvorbo besedila v sliko, ki prikazuje rezultate iz Dall-E 3 in Midjourney, in razloži razlike med obema generatorjema umetnosti.
Oba modela AI imata svoje prednosti in slabosti. Na primer, v pozivu o vesoljcu na Jupitru, Midjourney nekoliko presegel Dall-E 3. Vendar je bil v drugem pozivu o Wonder Woman Dall-E 3 natančnejši pri zajemanju bistva poziva.
- Hitra poslušnost: Dall-E 3 natančno sledi navodilom.
- Večplastna ustvarjalnost: na eni sliki lahko prikazuje več znakov.
- Integracija besedila: Dall-E 3 lahko nemoteno integrira besedilo v slike.
- Jasnost slike: včasih ustvari slike z zamegljenimi obrazi in očmi.
- Slog doslednosti: Dall-E 3 ne posnema dosledno stilov določenih izvajalcev.
- Upravljanje slik: Pri upravljanju ustvarjenih slik na spletnem mestu Microsoft Bing obstajajo omejitve.
- Hitrost generiranja: Postopek generiranja Dall-E 3 je lahko počasnejši v primerjavi z drugimi modeli AI.
Zavrnitev odgovornosti
V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.
O avtorju
Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta.
več člankovDamir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta.