AI Wiki Art Technológia
Októbra 02, 2023

Dall-E 3 vs. Midjourney: Veľké porovnanie najpokročilejších generátorov umenia AI

Pridajte sa k nám na tejto vzrušujúcej ceste, keď preskúmame Dall-E 3 a Midjourneyjemnosti, zložitosti a nevyužitý potenciál. Tento článok zdôrazňuje najzaujímavejšie porovnania založené na výskume, ktorý vykonal nadšenec AI Atachkina; ak máte záujem dozvedieť sa viac, kliknite na odkaz.

Dall-E 3 vs. Midjourney: Veľké porovnanie najpokročilejších generátorov umenia AI
Pro Tipy
1. Odkryte 50 najlepších výziev na prevod textu na obrázok pre generátory umenia AI Midjourney a DALL-E.
2. Zapnite svoju kreativitu s 20 najlepších generátorov umenia textu na obrázok AI z 2023.

Tento článok poskytuje výzvu na prevod textu na obrázok, obrázok zobrazujúci výsledky z Dall-E 3 a Midjourneya vysvetlenie rozdielov medzi nimi generátory umenia. Poďme začať.

výzva: Vesmírnik stojí na Jupiteri a pozoruje východ slnka. futuristické rozhranie, pohľad z prvej osoby, veliteľ vesmíru, dažďový merač a používateľské rozhranie HUD Rise

Obe neurónové siete si v tomto prípade viedli obdivuhodne, pričom Midjourney mierne prevyšuje ostatných.

výzva: natočené Slimom Aaronsom z Wonder Woman v miestnosti, zložité vrstvy a textúry, detailný dizajn postavy, pozadie s jasnými, náladovými a farebnými scénami, korekcia pastelových farieb ako vo filmoch Wesa Andersona, filmové zrno a Tokina AT-X 11-16mm f /2.8 pre dx ii

Dall-E 3 tu odviedol oveľa horšiu prácu; dostal svetlé farby štýlov, ale nie jasnosť detailov; v pozadí sa objavili deformované telá a tváre neboli vôbec úspešné.

výzva: obrázok roztomilého bacuľatého cybercot v jeho online sídle
prompt: profesionálne komerčné štúdiové fotenie pre Nike; model s dlhými vlasmi; strela celého tela; na sebe béžové tričko Nike; nezvyčajná džínsová bunda Nike; mäkká béžová plyšová taška nike; jemné fialové tenisky nike; stojaci na svetloružovo-modrom pozadí; futuristické pozadie zložitého efektívneho tvaru s podsvietením; natočené na Hasselblad X1D;

Obe miesta sa ukázali byť zaujímavé, ale Dall-E 3 sa opäť potrápil s tvárami. Namiesto toho vyrobila plyšovú béžovú tašku podľa pokynov vo výzve a Midjourney ignoroval to. V tomto prípade bol Dall-E 3 veľmi poslušný pri vykonávaní výzvy.

výzva: bublinová figúrka s lúčmi v pastelových farbách, ženská socha s kovovým povrchom, lesklá/lesklá, pulzujúca turbulencia, holubičie jadro, nekonvenčné pózy, anamorfické umenie, dúhovka/opalescencia, slučky spätnej väzby videa, lesklé oči, výrazné krivky, lesklý, tekutý figuratizmus
výzva: vintage retro koláž superhrdinov vrátane Wonder Woman, Captain America, Batman a The Joker

A ešte raz, zatiaľ čo obe mriežky vytvárajú vynikajúce koláže, Dall-E 3 je vernejší pokynom; pridalo len nami špecifikovaných hrdinov, nedokázalo sa zmeniť na žolíka a skrížilo kapitána s Batmanom.

výzva: metalická škvrna na sledovanie lúčov, anamorfické umenie, pútavé detaily, precízne línie, výrazné krivky, lesklý, plynulý figuratizmus, pastelové farby, tmavé pozadie
výzva: Jednoduché vrstvy a textúry, zložitý dizajn postáv, živé, náladové a farebné pozadia, pastelová korekcia farieb podľa filmov Wesa Andersona, zrnitosť filmu a objektív Tokina at-x 11-16 mm f/2.8 pro dx ii sú prítomné na tomto obrázku Spider-Mana relaxujúceho na pohovke od Slima Aaronsa.

Midjourney dokázal skombinovať príslušné štýly dvoch umelcov z výzvy, zatiaľ čo Dall-E 3 len pridal veľa rušných detailov a jasných farieb do pozadia.

výzva: Fotografia bacuľatých roztomilých tučných mačiek z 80. rokov, ktoré sa zúčastňujú na hodine aerobiku, zatiaľ čo majú športové zábavné leopardie legíny a ružové body, bola urobená na Kodak Gold 200.

Mačky sú opäť v špičkovej forme a obe neurónové siete dokonale rozumejú filmovým kamerám. Dall-E 3 však na obrázkoch dokonca pridáva zrno.

1990. roky minulého storočia Leonardo DiCaprio hrá majstra Jedi na ruskej dači, pričom má na rukách svetelný meč a má na sebe pletený zelený sveter.

Dall-E 3 vytvoril mladého Leonarda DiCapria s cool jumper textúrami, pridal filmové zrno a farebnú schému a veľmi chladne odrážal pocit ruskej dačy. Midjourney bola pre film dobrým farebným reflektorom a DiCaprio jej dodal vyzretejší vzhľad.

výzva: koláž z star Wars obrázky vo vintage retro štýle

Aj keď oboje neurálne siete sú zbehlí vo vytváraní koláží, ak sa pozriete pozorne, Midjourney deformuje tváre a niektoré tvary objektov, zatiaľ čo Dall-E 3 je presnejší v prevedení samotných postáv – dokonca sa ukázalo, že je to Chewbacca.

výzva: obrázok ruskej medúzy gorgon, ktorá má oblečené pouličné oblečenie Balenciaga hypebeast a prechádza sa po ulici na Manhattane s hadmi za vlasy

Keď priblížite fotografie, všimnete si, že Dall-E 3 má rozmazané oči; Midjourney, na druhej strane je bezchybný. Dall-E 3 tiež predpísal značku; hady na hlavách sa zdajú byť živšie a v pohybe; Midjourney vždy ich nútil ležať, nie na hlave.

Prompt: Táto ocenená fotografia od Slima Aaronsa zobrazuje pavúčieho muža preoblečeného za vílu, ktorý má na sebe ružové nadýchané šaty a drží čarovný prútik. Bol fotený fotoaparátom Fuji Superia X-TRA 800.

Obaja sú v pohode, ale Midjourney zvažoval štýl umelca aj efekt filmovej kamery, zatiaľ čo Dall-E 3 ignoroval celovečerný záber a nezohľadnil ho.

výzva: víla ZSSR s krídlami a kostýmom astronauta

Rozhodli sme sa tiež otestovať fotografiu s vílami, ale Dall-E 3 tvrdohlavo odmietal spolupracovať. Midjourney neignoroval krídla, pretože bol pridaný odkaz s krídlami. Keď Dall-E 3 urobil obrázok, ponúkol niekoľko zaujímavých možností, ale s Američankou.

výzva: slimák pózujúci pre portrét v súčasnom hipsterskom oblečení, komplexné vrstvy a textúry 4K, detailný dizajn postavy a zrnitosť filmu. Pozadie obsahuje živé, rozmarné a farebné scény.

Midjourney odviedli fantastickú prácu, ale chceme upozorniť najmä na to, ako Dall-E 3 vytvoril filmové efekty na obrázku vpravo hore a pridal vlastný biely rukopis; dopadlo to skvele.

výzva: Spider-Man, Batman a Iron Man sa stretli na pive v bare.

Dall-E 3 dokázal veľmi poslušne realizovať všetkých hrdinov výzvy na jednom obrázku. Midjourney sa veľmi snažil a dokonca bol blízko k úspechu.

Výzva: Letný šalát z paradajok a uhoriek, makro, plná scéna, teplé farby, vysokokvalitné fotorealistické hyperrealistické, prirodzené osvetlenie, Unreal Engine 5, color grading, redakčná fotografia, fotografia, fotenie, vysoký, epický, artgerm, fotené 70 mm objektívom, Hĺbka ostrosti, DOF, Tilt Blur, Rýchlosť uzávierky 1/1000, F/22, Vyváženie bielej, 32k, Super-rozlíšenie

Na prvý pohľad sa zdá, že obe sú dobré, no pri bližšom skúmaní sa ukáže, že Dall-E 3 nemá fotorealistický objem a že Midjourney zvládol spoje s vidličkami s buchnutím.

výzva: McDonald's v štýle nápaditých vesmírnych scenérií s realistickými ľudskými postavami, dvoma autami a traktorom s mesiacom nad ním. Les Nasbis, Pierre Pellegrini, vedecky podložená, priekopnícka tučná sýtosť, firecore

Oba generátory sú zdatné vo svojich oblastiach, pričom Dall-E 3 vyniká v texte a Midjourney vyniká vo fotorealizme.

Sušič vlasov BaByliss D570DE sa používa v modernom interiéri s večerným osvetlením, industriálnym dizajnom a pastelovými farbami, ideálny pre štúdiové natáčanie.

Fyzika a geometria fénov sú náročné Midjourney. Môžete stráviť veľa času zápasením s pokusmi a referenciami a občas výsledky pripomínajú fén, ale Dall-E 3 priniesol prijateľný výsledok na prvý pokus a dokonca napísal text.

výzva: fotografia jednookej Turangy Leely z futuramy

Jediné oko je dobré, ale to je už iný príbeh. In Midjourney, napísali sme negatívnu výzvu – žiadna karikatúra, ilustrácia, plochá, dve oči. Dall-E 3 okamžite poslúchla a urobila jedno oko, úsmev a klobúk dolu, ale rozhodne odmietla, aby ju niekto odfotil.

Herec Brad Pitt je videný v 1990. rokoch, ako polieva zeleninové záhony na ruskej chate, pričom má na sebe pruhované tielko a tepláky od adidas. Scéna bola zachytená na Agfa Vista 400.

Midjourney spôsobili, že generácia nemala rada Brada, a tak sme použili extra službu Insight Face Swap dať Bradovu tvár generácii; bol tu o tom príspevok. Dall-E 3 vie, kto je Brad Pitt a dokáže kresliť hviezdy bez akéhokoľvek dodatočného softvéru.

výzva: krásne dievča, jednorožce, jablkové technológie a retro retro koláž galaxií

Obe siete sú dobré, ale Dall-E 3 dokáže vytvoriť rohy jednorožca Midjourney zvyčajne nemôže.

výzva: zmrzlina v ruke, športové oblečenie nike a úžasný fantasy elf sediaci vedľa orka na fotke z ulice.

Dall-E 3 odviedol dobrú prácu pri uvedení postáv do akcie; môžeme vidieť orka a elfa s elfskými ušami. Je tam aj človek v teplákovej súprave Nike, no oči má rozmazané. Elfské špicaté uši sú väčšinou ignorované Midjourneya Nike sa tiež neberie do úvahy.

výzva: kresba víly ZSSR oblečenej ako astronaut

Keď bola postscriptová „ilustrácia“ pôvodne vynechaná z výzvy, Dall-E 3 ju vytvoril. Potom sme sa rozhodli to porovnať Midjourneyilustrácia. Zatiaľ čo Midjourney Dall-E 3, ktorý sa viac podobal ilustráciám zo sovietskej éry a neobsahoval krídla víly, odviedol fantastickú prácu pri kreslení kosáka a kladiva. Príklad vpravo ukazuje, ako by sa Dall-E 3 mohol objaviť v texte.

výzva: Dača na Jupiteri, v diaľke vidno orbitálne prstence planéty, mimozemšťan varí grilovačku, zložitý dizajn postáv, svetlé, bláznivé a farebné pozadia, pastelová korekcia farieb a la filmy Wes Anderson, filmové zrno a Tokina AT -X 11-16mm f/2.8 Pro dX II objektív

Avšak, Midjourney prešiel do fotorealizmu; na obrazoch nie je ziadna hlavna postava, len okolie, ale aj tak v pohode. Dall-E 3 nechcel byť opäť na fotke.

výzva: filmové zrno, krmivo pre psov, zložitý dizajn postáv, vrstvy a textúry, svetlé, bláznivé a farebné scény v pozadí a korekcia pastelových farieb ako vo filme Wesa Andersona

Dall-E 3 vs. Midjourney: Klady a zápory

Ako používatelia skúmajú túto technológiu, vyšlo najavo niekoľko pozoruhodných silných stránok a obmedzení, čo prináša ďalší pohľad na jej funkčnosť.

Pros:

  1. Pohotová poslušnosť: Jednou z výnimočných vlastností Dall-E 3 je jeho pozoruhodná schopnosť presne sledovať výzvy. Používatelia uviedli, že model AI efektívne reaguje na široký rozsah vstupov, čo z neho robí všestranný nástroj pre rôzne úlohy.
  2. Mnohostranná kreativita: Dall-E 3 vykazuje schopnosť zobraziť viacero postáv v rámci jedného obrázka, čím rozširuje svoj potenciál pre rozprávanie príbehov a kreatívne projekty. Tento mnohostranný prístup zvyšuje jeho užitočnosť v rôznych doménach.
  3. Integrácia textu: Používatelia si všimli, že Dall-E 3 je schopný bezproblémovo integrovať text do obrázkov. Táto funkcia uľahčuje vytváranie vizuálne pútavého obsahu s vloženými textovými prvkami.

Nevýhody:

  1. Jasnosť obrázka: Významným obmedzením je tendencia AI vytvárať obrázky s rozmazanými tvárami a očami. Aj keď vyniká kreativitou, niekedy mu chýba jasnosť a presnosť, ktorú možno vidieť v obsahu vytváranom ľuďmi.
  2. Konzistencia štýlu: Dall-E 3 dôsledne nekopíruje štýly konkrétnych umelcov, čo môže byť nevýhodou pre tých, ktorí hľadajú precíznu umeleckú emuláciu.
  3. Požiadavka VPN: Prístup k Dall-E 3 si v súčasnosti vyžaduje použitie VPN, čo môže pre niektorých používateľov predstavovať problémy s prístupnosťou.
  4. Správa obrázkov: Používatelia narazili na obmedzenia pri správe generovaných obrázkov na webovej lokalite Microsoft Bing. Predovšetkým tu nie je funkcia orientácie formátu a história obrázkov je obmedzená na najnovšie nahrané súbory, čo si vyžaduje okamžité skopírovanie na neskoršie použitie.
  5. Rýchlosť generovania: V niektorých prípadoch sa uvádza, že proces generovania v Dall-E 3 je pomalší v porovnaní s inými modelmi AI.

Napriek týmto obmedzeniam má Dall-E 3 značný prísľub. Používatelia aj odborníci uznávajú jeho potenciál spôsobiť revolúciu vo vytváraní obsahu a rozprávaní príbehov. Ako OpenAI pokračuje vo zdokonaľovaní a rozširovaní svojej ponuky, očakáva sa, že silné stránky Dall-E 3 budú žiariť ešte jasnejšie, čím sa stane cenným nástrojom v rôznych oblastiach.

Často kladené otázky

Obaja Dall-E 3 a Midjourney majú svoje silné a slabé stránky. Dall-E 3 je pozoruhodne poslušný výzvam a dokáže bez problémov integrovať text do obrázkov. Niekedy však vytvára obrázky s rozmazanými tvárami a očami a nemusí dôsledne kopírovať štýly konkrétnych umelcov. Na druhej strane, Midjourney vyniká vo fotorealizme, ale nemusí vždy zachytiť podstatu určitých podnetov tak presne ako Dall-E 3.

Článok poskytuje výzvy na prevod textu na obrázok a predstavuje výsledky z Dall-E 3 a Midjourneya vysvetľuje rozdiely medzi týmito dvoma generátormi umenia.

Oba modely AI majú svoje silné a slabé stránky. Napríklad vo výzve o vesmírnom mužovi na Jupiteri, Midjourney mierne prekonala Dall-E 3. V ďalšej výzve o Wonder Woman však Dall-E 3 presnejšie vystihla podstatu výzvy.

  • Pohotová poslušnosť: Dall-E 3 presne dodržiava pokyny.
  • Mnohostranná kreativita: Môže zobrazovať viacero postáv na jednom obrázku.
  • Integrácia textu: Dall-E 3 dokáže bezproblémovo integrovať text do obrázkov.
  • Jasnosť obrazu: Niekedy vytvára obrázky s rozmazanými tvárami a očami.
  • Konzistentnosť štýlu: Dall-E 3 dôsledne nereplikuje štýly konkrétnych umelcov.
  • Správa obrázkov: Pri správe generovaných obrázkov na webovej lokalite Microsoft Bing existujú obmedzenia.
  • Rýchlosť generácie: Proces generovania Dall-E 3 môže byť pomalší v porovnaní s inými modelmi AI.

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Side Protocol spúšťa motivovanú testovaciu sieť a zavádza systém Insider Point System, ktorý používateľom umožňuje získavať SIDE body
trhy Novinová správa Technológia
Side Protocol spúšťa motivovanú testovaciu sieť a zavádza systém Insider Point System, ktorý používateľom umožňuje získavať SIDE body
Môže 9, 2024
Web3 a krypto udalosti v máji 2024: Skúmanie nových technológií a nových trendov v blockchaine a DeFi
výťah firmy trhy Technológia
Web3 a krypto udalosti v máji 2024: Skúmanie nových technológií a nových trendov v blockchaine a DeFi
Môže 9, 2024
Notcoin na spustenie na OKX Jumpstart ponúka 1.25 % celkovej dodávky tokenov na ťažbu
trhy Novinová správa Technológia
Notcoin na spustenie na OKX Jumpstart ponúka 1.25 % celkovej dodávky tokenov na ťažbu
Môže 9, 2024
Puffer Finance spúšťa svoju hlavnú sieť, zlepšuje začlenenie operátorov uzlov pre decentralizáciu siete
Novinová správa Technológia
Puffer Finance spúšťa svoju hlavnú sieť, zlepšuje začlenenie operátorov uzlov pre decentralizáciu siete
Môže 9, 2024
CRYPTOMERIA LABS PTE. LTD.