AI Wiki Umetnost Tehnologija
Oktober 02, 2023

Dall-E 3 vs. Midjourney: velika primerjava najnaprednejših umetniških generatorjev z umetno inteligenco

Pridružite se nam na tem vznemirljivem potovanju, ko raziskujemo Dall-E 3 in Midjourneysubtilnosti, zapletenosti in neizkoriščenega potenciala. Ta članek izpostavlja najbolj zanimive primerjave na podlagi raziskave, ki jo je izvedla navdušenka AI Atachkina; če vas zanima več, kliknite povezava.

Dall-E 3 vs. Midjourney: velika primerjava najnaprednejših umetniških generatorjev z umetno inteligenco
Pro Nasveti
1. Odkrijte 50 najbolj priljubljenih pozivov za pretvorbo besedila v sliko za AI Art Generators Midjourney in DALL-E.
2. Razvnemite svojo ustvarjalnost z 20 najboljših AI umetniških generatorjev besedila v sliko 2023.

Ta članek vsebuje poziv za pretvorbo besedila v sliko, sliko, ki prikazuje rezultate Dall-E 3 in Midjourney, in razlago razlik med obema generatorji umetnosti. Začnimo.

poziv: vesolec stoji na Jupitru in opazuje sončni vzhod. futuristični vmesnik, prvoosebna perspektiva, vesoljski poveljnik, merilnik dežja in uporabniški vmesnik HUD Rise

Obe nevronski mreži sta se v tem primeru obnesli čudovito, z Midjourney nekoliko prekaša druge.

poziv: posnel Slim Aarons iz Čudežne ženske v sobi, zapletene plasti in teksture, podrobno oblikovanje likov, ozadje s svetlimi, muhastimi in barvitimi prizori, popravek pastelnih barv, kot v filmih Wesa Andersona, zrnatost filma in Tokina AT-X 11-16 mm f /2.8 pro dx ii

Dall-E 3 je tukaj opravil precej slabše delo; dobil je svetle barve slogov, ne pa tudi jasnosti podrobnosti; v ozadju so se pojavila deformirana telesa, obrazi pa niso bili prav nič uspešni.

poziv: slika ljubkega, debelušnega cybercota v njegovi spletni rezidenci
hitro: profesionalno komercialno studijsko fotografiranje za Nike; model z dolgimi lasmi; posnetek celega telesa; oblečen v bež majico Nike; nenavadna denim jakna Nike; torba nike iz mehkega bež pliša; nežno vijolične superge nike; stoji na svetlo roza-modrem ozadju; futuristično ozadje kompleksne poenostavljene oblike z osvetlitvijo ozadja; posneto na Hasselblad X1D;

Obe strani se je izkazalo za zanimivo, vendar se je Dall-E 3 znova spopadel z obrazi. Namesto tega je izdelal plišasto bež vrečko, kot je bilo navedeno v pozivu, in Midjourney ni upošteval. V tem primeru je bil Dall-E 3 zelo poslušen pri izvajanju poziva.

poziv: mehurčkasta figura s sledjo žarkov v pastelnih barvah, ženska skulptura s kovinskimi zaključki, sijoča/bleščeča, živahna turbulenca, golobje jedro, nekonvencionalne poze, anamorfna umetnost, prelivanje/opalescenca, video povratne zanke, sijoče oči, drzne krivulje, sijoča, tekoča figuratičnost
poziv: vintage retro kolaž superjunakov, vključno s Wonder Woman, Captain America, Batman in The Joker

In še enkrat, medtem ko sta obe mreži odlična kolaža, je Dall-E 3 bolj zvest pozivu; dodal je samo junake, ki smo jih določili, ni se mogel spremeniti v jokerja in prekrižal je kapitana z Batmanom.

hiter: kovinski madež s sledenjem žarkom, anamorfna umetnost, vpadljivi detajli, natančne linije, drzne krivulje, sijoča, tekoča figuratičnost, pastelne barve, temno ozadje
poziv: preproste plasti in teksture, zapletena zasnova likov, živa, muhasta in barvita ozadja, pastelni barvni popravek v stilu filmov Wesa Andersona, zrnatost filma in objektiv Tokina at-x 11-16 mm f/2.8 pro dx ii so prisotni na tej sliki Spider-Mana, ki se sprošča na kavču, posnel Slim Aarons.

Midjourney je lahko združil ustrezne sloge obeh umetnikov iz poziva, medtem ko je Dall-E 3 v ozadje samo dodal veliko živahnih podrobnosti in svetlih barv.

poziv: fotografija iz 80. let prejšnjega stoletja debelušnih ljubkih debelih mačk, ki sodelujejo pri uri aerobike, medtem ko nosijo zabavne leopardje pajkice in roza bodije, je bila posneta na Kodak Gold 200.

Tudi tokrat so mačke v vrhunski formi in obe nevronski mreži odlično razumeta filmske kamere. Vendar pa Dall-E 3 celo doda zrnatost slikam.

V devetdesetih letih 1990. stoletja Leonardo DiCaprio igra mojstra jedija na ruski dači, medtem ko vihti svetlobni meč in nosi pleten zelen jopič.

Dall-E 3 je ustvaril mladega Leonarda DiCapria s kul teksturami skakalcev, dodano filmsko zrnatostjo in barvno shemo ter zelo kul odseval občutek ruske dače. Midjourney je bila dober barvni odbojnik za film, DiCaprio pa ji je dal bolj zrel videz.

poziv: kolaž Vojna zvezd slike v vintage retro slogu

Čeprav oboje nevronske mreže so vešči ustvarjanja kolažev, če pogledate od blizu, Midjourney izkrivlja obraze in nekatere oblike predmetov, medtem ko je Dall-E 3 natančnejši pri izvedbi samih likov - izkazalo se je celo, da je Chewbacca.

poziv: slika ruske gorgone meduze, ki nosi ulično oblačilo Balenciaga hypebeast in se sprehaja po ulici na Manhattnu s kačami za lase

Ko povečate fotografije, boste opazili, da ima Dall-E 3 zamegljene oči; Midjourney, po drugi strani pa je brezhiben. Dall-E 3 je predpisal tudi blagovno znamko; kače na glavah se zdijo bolj žive in v gibanju; Midjourney vedno jih je naredil leže, namesto na glavi.

Poziv: Ta nagrajena fotografija Slima Aaronsa prikazuje človeka pajka, preoblečenega v vilo, ki nosi rožnato puhasto obleko in drži čarobno palico. Posneto je bilo s fotoaparatom Fuji Superia X-TRA 800.

Oboje je kul, ampak Midjourney upošteval umetnikov slog kot tudi učinek filmske kamere, medtem ko Dall-E 3 ni upošteval celovečernega posnetka in ga ni upošteval.

poziv: vila ZSSR s krili in kostumom astronavta

Odločili smo se tudi za test fotografije z vilami, vendar je Dall-E 3 vztrajno zavrnil sodelovanje. Midjourney ni prezrl kril, ker je bila dodana referenca s krili. Ko je Dall-E 3 posnel sliko, je ponudil nekaj zanimivih možnosti, vendar z Američanko.

poziv: polž, ki pozira za portret, oblečen v sodobno hipstersko obleko, kompleksne plasti in teksture 4K, podrobno oblikovanje likov in zrnatost filma. V ozadju so živahni, muhasti in barviti prizori.

Midjourney opravili fantastično delo, vendar želimo posebno pozornost opozoriti na to, kako je Dall-E 3 ustvaril filmske učinke na zgornji desni sliki in dodal lastno belo pisavo; izkazalo se je super.

poziv: Spider-Man, Batman in Iron Man so se zbrali na pivu v baru.

Dall-E 3 je uspel zelo poslušno uresničiti vse junake poziva v eni sliki. Midjourney zelo trudila in se celo približala uspehu.

Poziv: Poletna solata iz paradižnika in kumar, makro, polna scena, tople barve, visoka kakovost fotorealistično hiperrealistično, naravna svetloba, Unreal Engine 5, barvno ocenjevanje, uredniška fotografija, fotografija, fotografiranje, Tall, epic, artgerm, posneto s 70 mm objektivom, globinska ostrina, DOF, zameglitev z nagibom, hitrost zaklopa 1/1000, F/22, ravnovesje beline, 32k, super ločljivost

Na prvi pogled se zdi, da sta oba dobra, vendar natančnejši pregled razkrije, da Dall-E 3 nima fotorealistične glasnosti in da Midjourney s pokom obdelal sklepe z vilicami.

prompt: McDonald's v slogu domišljijske vesoljske pokrajine z realističnimi človeškimi figurami, dvema avtomobiloma in traktorjem, nad njim pa luna. Les Nasbis, Pierre Pellegrini, znanstveno utemeljena, pionirska drzna nasičenost, firecore

Oba generatorja sta vešča na svojih področjih, pri čemer je Dall-E 3 odličen v besedilu in Midjourney blesti v fotorealizmu.

Sušilnik za lase BaByliss D570DE se uporablja v moderni notranjosti z večerno osvetlitvijo, industrijskim dizajnom in pastelnimi barvami, kot nalašč za studijsko snemanje.

Fizika in geometrija sušilnikov za lase sta težki Midjourney. Lahko porabite veliko časa, da se ubadate s poskusi in referencami, občasno pa rezultati spominjajo na fen, vendar je Dall-E 3 v prvem poskusu dal sprejemljiv rezultat in celo napisal besedilo.

poziv: fotografija enooke Turange Leele iz futurame

Edino oko je dobro, a to je že druga zgodba. notri Midjourney, smo napisali negativni poziv – brez risanke, ilustracija, ravno, dve očesi. Dall-E 3 je takoj ubogal in naredil eno oko, nasmeh in dol, vendar je odločno zavrnil, da bi jo kdorkoli fotografiral.

Igralec Brad Pitt v devetdesetih letih 1990. stoletja zaliva gredice zelenjavnega vrta na ruski dači, medtem ko nosi črtasto majico brez rokavov in adidasove trenirke. Prizor je bil posnet na Agfa Vista 400.

Midjourney generacija ni bila podobna Bradu, zato smo uporabili dodatno storitev Insight Face Swap prikazati Bradov obraz generaciji; tukaj je bila objava o tem. Dall-E 3 ve, kdo je Brad Pitt in lahko nariše zvezde brez dodatne programske opreme.

poziv: lepo dekle, samorogi, jabolčne tehnologije in vintage retro kolaž galaksij

Obe mreži sta dobri, vendar lahko Dall-E 3 ustvari rogove samoroga Midjourney običajno ne more.

poziv: sladoled v roki, športna oblačila nike in osupljiv domišljijski škratek, ki sedi poleg orka na ulični fotografiji.

Dall-E 3 je dobro udejanjil like; lahko vidimo orka in vilenjaka z vilinskimi ušesi. Obstaja tudi oseba, ki nosi trenirko Nike, vendar ima zamazane oči. Vilinska koničasta ušesa večinoma ignorirajo Midjourney, Nike pa je tudi zanemarjen.

poziv: risba vile ZSSR, oblečene v astronavta

Ko je bil postscript "ilustracija" sprva izpuščen iz poziva, jo je Dall-E 3 ustvaril. Nato smo se odločili, da ga primerjamo z Midjourneyilustracija. Medtem Midjourney bolj podoben ilustracijam iz sovjetskega obdobja in ni vključeval pravljičnih kril, je Dall-E 3 odlično opravil risanje srpa in kladiva. Primer na desni prikazuje, kako bi lahko Dall-E 3 izgledal v besedilu.

poziv: dača na Jupitru, orbitalni obroči planeta so vidni v daljavi, vesoljec peče žar, zapletena zasnova likov, svetla, čudaška in barvita ozadja, popravek pastelnih barv v stilu filmov Wesa Andersona, zrnatost filma in Tokina AT -X 11-16mm f/2.8 Pro dX II objektiv

Vendar pa Midjourney šel v fotorealizem; na slikah ni glavnega junaka, samo okolica, a vseeno kul. Dall-E 3 ni več hotel biti na fotografiji.

hitro: filmska zrna, hrana za pse, zapletena zasnova likov, plasti in teksture, svetli, čudaški in barviti prizori v ozadju ter popravek pastelnih barv kot v filmu Wesa Andersona

Dall-E 3 vs. Midjourney: Prednosti in slabosti

Ko uporabniki raziskujejo to tehnologijo, je prišlo na dan več pomembnih prednosti in omejitev, kar daje nadaljnji vpogled v njeno funkcionalnost.

Prednosti:

  1. Takojšnja poslušnost: Ena od izstopajočih lastnosti Dall-E 3 je njegova izjemna sposobnost natančnega sledenja navodilom. Uporabniki so poročali, da se model AI učinkovito odziva na širok spekter vnosov, zaradi česar je vsestransko orodje za različne naloge.
  2. Večplastna ustvarjalnost: Dall-E 3 izkazuje zmožnost upodabljanja več likov znotraj ene slike, s čimer širi svoj potencial za pripovedovanje zgodb in ustvarjalne projekte. Ta večplastni pristop povečuje njegovo uporabnost na različnih področjih.
  3. Integracija besedila: Uporabniki so opazili spretnost Dall-E 3 pri brezhibnem vključevanju besedila v slike. Ta funkcija olajša ustvarjanje vizualno privlačne vsebine z vdelanimi besedilnimi elementi.

Slabosti:

  1. Jasnost slike: Pomembna omejitev je težnja umetne inteligence, da ustvari slike z zamegljenimi obrazi in očmi. Čeprav se odlikuje po ustvarjalnosti, mu včasih manjka jasnosti in natančnosti, ki ju vidimo pri vsebini, ki jo ustvari človek.
  2. Skladnost sloga: Dall-E 3 ne posnema dosledno stilov določenih umetnikov, kar je lahko pomanjkljivost za tiste, ki iščejo natančno umetniško posnemanje.
  3. Zahteva VPN: Dostop do Dall-E 3 trenutno zahteva uporabo VPN-ja, kar lahko nekaterim uporabnikom predstavlja izzive glede dostopnosti.
  4. Upravljanje slik: Uporabniki so naleteli na omejitve pri upravljanju ustvarjenih slik na spletnem mestu Microsoft Bing. Predvsem ni funkcije orientacije formata, zgodovina slik pa je omejena na nedavna nalaganja, kar zahteva takojšnje kopiranje za kasnejšo uporabo.
  5. Hitrost generiranja: V nekaterih primerih so poročali, da je proces generiranja v Dall-E 3 počasnejši v primerjavi z drugimi modeli AI.

Kljub tem omejitvam Dall-E 3 veliko obeta. Uporabniki in strokovnjaki priznavajo njen potencial za revolucijo pri ustvarjanju vsebin in pripovedovanju zgodb. Kot OpenAI še naprej izpopolnjuje in širi svojo ponudbo, se pričakuje, da bodo prednosti Dall-E 3 še bolj zasijale, zaradi česar bo postal dragoceno orodje na različnih področjih.

Pogosta vprašanja

Tako Dall-E 3 kot Midjourney imajo svoje prednosti in slabosti. Dall-E 3 je zlasti poslušen pozivom in lahko brezhibno integrira besedilo v slike. Vendar pa včasih ustvari slike z zamegljenimi obrazi in očmi in morda ne posnema dosledno stilov določenih umetnikov. Po drugi strani, Midjourney odlikuje ga fotorealizem, vendar morda ne zajame vedno bistva določenih pozivov tako natančno kot Dall-E 3.

Članek vsebuje pozive za pretvorbo besedila v sliko, ki prikazuje rezultate iz Dall-E 3 in Midjourney, in razloži razlike med obema generatorjema umetnosti.

Oba modela AI imata svoje prednosti in slabosti. Na primer, v pozivu o vesoljcu na Jupitru, Midjourney nekoliko presegel Dall-E 3. Vendar je bil v drugem pozivu o Wonder Woman Dall-E 3 natančnejši pri zajemanju bistva poziva.

  • Hitra poslušnost: Dall-E 3 natančno sledi navodilom.
  • Večplastna ustvarjalnost: na eni sliki lahko prikazuje več znakov.
  • Integracija besedila: Dall-E 3 lahko nemoteno integrira besedilo v slike.
  • Jasnost slike: včasih ustvari slike z zamegljenimi obrazi in očmi.
  • Slog doslednosti: Dall-E 3 ne posnema dosledno stilov določenih izvajalcev.
  • Upravljanje slik: Pri upravljanju ustvarjenih slik na spletnem mestu Microsoft Bing obstajajo omejitve.
  • Hitrost generiranja: Postopek generiranja Dall-E 3 je lahko počasnejši v primerjavi z drugimi modeli AI.

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Hot Stories
Pridružite se našemu glasilu.
Zadnje novice

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Nexo začne 'lov' za nagrajevanje uporabnikov z 12 milijoni $ v žetonih NEXO za sodelovanje z njegovim ekosistemom
Prisotnost Novice Tehnologija
Nexo začne 'lov' za nagrajevanje uporabnikov z 12 milijoni $ v žetonih NEXO za sodelovanje z njegovim ekosistemom
Maj 8, 2024
Revolutova borza Revolut X navdušuje kripto trgovce z ničelnimi provizijami in napredno analitiko
Prisotnost Software Zgodbe in ocene Tehnologija
Revolutova borza Revolut X navdušuje kripto trgovce z ničelnimi provizijami in napredno analitiko
Maj 8, 2024
Lisk uradno prehaja na Ethereum Layer 2 in razkriva Core v4.0.6
Novice Tehnologija
Lisk uradno prehaja na Ethereum Layer 2 in razkriva Core v4.0.6
Maj 8, 2024
Novi meme kovanci maja 2024: 7 izbir za ljubitelje kriptovalut
prebaviti Prisotnost Tehnologija
Novi meme kovanci maja 2024: 7 izbir za ljubitelje kriptovalut
Maj 8, 2024
CRYPTOMERIA LABS PTE. LTD.