Dall-E 3 vs. Midjourney: Veľké porovnanie najpokročilejších generátorov umenia AI
Pridajte sa k nám na tejto vzrušujúcej ceste, keď preskúmame Dall-E 3 a Midjourneyjemnosti, zložitosti a nevyužitý potenciál. Tento článok zdôrazňuje najzaujímavejšie porovnania založené na výskume, ktorý vykonal nadšenec AI Atachkina; ak máte záujem dozvedieť sa viac, kliknite na odkaz.
Pro Tipy |
---|
1. Odkryte 50 najlepších výziev na prevod textu na obrázok pre generátory umenia AI Midjourney a DALL-E. |
2. Zapnite svoju kreativitu s 20 najlepších generátorov umenia textu na obrázok AI z 2023. |
Tento článok poskytuje výzvu na prevod textu na obrázok, obrázok zobrazujúci výsledky z Dall-E 3 a Midjourneya vysvetlenie rozdielov medzi nimi generátory umenia. Poďme začať.
Obe neurónové siete si v tomto prípade viedli obdivuhodne, pričom Midjourney mierne prevyšuje ostatných.
Dall-E 3 tu odviedol oveľa horšiu prácu; dostal svetlé farby štýlov, ale nie jasnosť detailov; v pozadí sa objavili deformované telá a tváre neboli vôbec úspešné.
Obe miesta sa ukázali byť zaujímavé, ale Dall-E 3 sa opäť potrápil s tvárami. Namiesto toho vyrobila plyšovú béžovú tašku podľa pokynov vo výzve a Midjourney ignoroval to. V tomto prípade bol Dall-E 3 veľmi poslušný pri vykonávaní výzvy.
A ešte raz, zatiaľ čo obe mriežky vytvárajú vynikajúce koláže, Dall-E 3 je vernejší pokynom; pridalo len nami špecifikovaných hrdinov, nedokázalo sa zmeniť na žolíka a skrížilo kapitána s Batmanom.
Midjourney dokázal skombinovať príslušné štýly dvoch umelcov z výzvy, zatiaľ čo Dall-E 3 len pridal veľa rušných detailov a jasných farieb do pozadia.
Mačky sú opäť v špičkovej forme a obe neurónové siete dokonale rozumejú filmovým kamerám. Dall-E 3 však na obrázkoch dokonca pridáva zrno.
Dall-E 3 vytvoril mladého Leonarda DiCapria s cool jumper textúrami, pridal filmové zrno a farebnú schému a veľmi chladne odrážal pocit ruskej dačy. Midjourney bola pre film dobrým farebným reflektorom a DiCaprio jej dodal vyzretejší vzhľad.
Aj keď oboje neurálne siete sú zbehlí vo vytváraní koláží, ak sa pozriete pozorne, Midjourney deformuje tváre a niektoré tvary objektov, zatiaľ čo Dall-E 3 je presnejší v prevedení samotných postáv – dokonca sa ukázalo, že je to Chewbacca.
Keď priblížite fotografie, všimnete si, že Dall-E 3 má rozmazané oči; Midjourney, na druhej strane je bezchybný. Dall-E 3 tiež predpísal značku; hady na hlavách sa zdajú byť živšie a v pohybe; Midjourney vždy ich nútil ležať, nie na hlave.
Obaja sú v pohode, ale Midjourney zvažoval štýl umelca aj efekt filmovej kamery, zatiaľ čo Dall-E 3 ignoroval celovečerný záber a nezohľadnil ho.
Rozhodli sme sa tiež otestovať fotografiu s vílami, ale Dall-E 3 tvrdohlavo odmietal spolupracovať. Midjourney neignoroval krídla, pretože bol pridaný odkaz s krídlami. Keď Dall-E 3 urobil obrázok, ponúkol niekoľko zaujímavých možností, ale s Američankou.
Midjourney odviedli fantastickú prácu, ale chceme upozorniť najmä na to, ako Dall-E 3 vytvoril filmové efekty na obrázku vpravo hore a pridal vlastný biely rukopis; dopadlo to skvele.
Dall-E 3 dokázal veľmi poslušne realizovať všetkých hrdinov výzvy na jednom obrázku. Midjourney sa veľmi snažil a dokonca bol blízko k úspechu.
Na prvý pohľad sa zdá, že obe sú dobré, no pri bližšom skúmaní sa ukáže, že Dall-E 3 nemá fotorealistický objem a že Midjourney zvládol spoje s vidličkami s buchnutím.
Oba generátory sú zdatné vo svojich oblastiach, pričom Dall-E 3 vyniká v texte a Midjourney vyniká vo fotorealizme.
Fyzika a geometria fénov sú náročné Midjourney. Môžete stráviť veľa času zápasením s pokusmi a referenciami a občas výsledky pripomínajú fén, ale Dall-E 3 priniesol prijateľný výsledok na prvý pokus a dokonca napísal text.
Jediné oko je dobré, ale to je už iný príbeh. In Midjourney, napísali sme negatívnu výzvu – žiadna karikatúra, ilustrácia, plochá, dve oči. Dall-E 3 okamžite poslúchla a urobila jedno oko, úsmev a klobúk dolu, ale rozhodne odmietla, aby ju niekto odfotil.
Midjourney spôsobili, že generácia nemala rada Brada, a tak sme použili extra službu Insight Face Swap dať Bradovu tvár generácii; bol tu o tom príspevok. Dall-E 3 vie, kto je Brad Pitt a dokáže kresliť hviezdy bez akéhokoľvek dodatočného softvéru.
Obe siete sú dobré, ale Dall-E 3 dokáže vytvoriť rohy jednorožca Midjourney zvyčajne nemôže.
Dall-E 3 odviedol dobrú prácu pri uvedení postáv do akcie; môžeme vidieť orka a elfa s elfskými ušami. Je tam aj človek v teplákovej súprave Nike, no oči má rozmazané. Elfské špicaté uši sú väčšinou ignorované Midjourneya Nike sa tiež neberie do úvahy.
Keď bola postscriptová „ilustrácia“ pôvodne vynechaná z výzvy, Dall-E 3 ju vytvoril. Potom sme sa rozhodli to porovnať Midjourneyilustrácia. Zatiaľ čo Midjourney Dall-E 3, ktorý sa viac podobal ilustráciám zo sovietskej éry a neobsahoval krídla víly, odviedol fantastickú prácu pri kreslení kosáka a kladiva. Príklad vpravo ukazuje, ako by sa Dall-E 3 mohol objaviť v texte.
Avšak, Midjourney prešiel do fotorealizmu; na obrazoch nie je ziadna hlavna postava, len okolie, ale aj tak v pohode. Dall-E 3 nechcel byť opäť na fotke.
Dall-E 3 vs. Midjourney: Klady a zápory
Ako používatelia skúmajú túto technológiu, vyšlo najavo niekoľko pozoruhodných silných stránok a obmedzení, čo prináša ďalší pohľad na jej funkčnosť.
Pros:
- Pohotová poslušnosť: Jednou z výnimočných vlastností Dall-E 3 je jeho pozoruhodná schopnosť presne sledovať výzvy. Používatelia uviedli, že model AI efektívne reaguje na široký rozsah vstupov, čo z neho robí všestranný nástroj pre rôzne úlohy.
- Mnohostranná kreativita: Dall-E 3 vykazuje schopnosť zobraziť viacero postáv v rámci jedného obrázka, čím rozširuje svoj potenciál pre rozprávanie príbehov a kreatívne projekty. Tento mnohostranný prístup zvyšuje jeho užitočnosť v rôznych doménach.
- Integrácia textu: Používatelia si všimli, že Dall-E 3 je schopný bezproblémovo integrovať text do obrázkov. Táto funkcia uľahčuje vytváranie vizuálne pútavého obsahu s vloženými textovými prvkami.
Nevýhody:
- Jasnosť obrázka: Významným obmedzením je tendencia AI vytvárať obrázky s rozmazanými tvárami a očami. Aj keď vyniká kreativitou, niekedy mu chýba jasnosť a presnosť, ktorú možno vidieť v obsahu vytváranom ľuďmi.
- Konzistencia štýlu: Dall-E 3 dôsledne nekopíruje štýly konkrétnych umelcov, čo môže byť nevýhodou pre tých, ktorí hľadajú precíznu umeleckú emuláciu.
- Požiadavka VPN: Prístup k Dall-E 3 si v súčasnosti vyžaduje použitie VPN, čo môže pre niektorých používateľov predstavovať problémy s prístupnosťou.
- Správa obrázkov: Používatelia narazili na obmedzenia pri správe generovaných obrázkov na webovej lokalite Microsoft Bing. Predovšetkým tu nie je funkcia orientácie formátu a história obrázkov je obmedzená na najnovšie nahrané súbory, čo si vyžaduje okamžité skopírovanie na neskoršie použitie.
- Rýchlosť generovania: V niektorých prípadoch sa uvádza, že proces generovania v Dall-E 3 je pomalší v porovnaní s inými modelmi AI.
Napriek týmto obmedzeniam má Dall-E 3 značný prísľub. Používatelia aj odborníci uznávajú jeho potenciál spôsobiť revolúciu vo vytváraní obsahu a rozprávaní príbehov. Ako OpenAI pokračuje vo zdokonaľovaní a rozširovaní svojej ponuky, očakáva sa, že silné stránky Dall-E 3 budú žiariť ešte jasnejšie, čím sa stane cenným nástrojom v rôznych oblastiach.
Často kladené otázky
Obaja Dall-E 3 a Midjourney majú svoje silné a slabé stránky. Dall-E 3 je pozoruhodne poslušný výzvam a dokáže bez problémov integrovať text do obrázkov. Niekedy však vytvára obrázky s rozmazanými tvárami a očami a nemusí dôsledne kopírovať štýly konkrétnych umelcov. Na druhej strane, Midjourney vyniká vo fotorealizme, ale nemusí vždy zachytiť podstatu určitých podnetov tak presne ako Dall-E 3.
Článok poskytuje výzvy na prevod textu na obrázok a predstavuje výsledky z Dall-E 3 a Midjourneya vysvetľuje rozdiely medzi týmito dvoma generátormi umenia.
Oba modely AI majú svoje silné a slabé stránky. Napríklad vo výzve o vesmírnom mužovi na Jupiteri, Midjourney mierne prekonala Dall-E 3. V ďalšej výzve o Wonder Woman však Dall-E 3 presnejšie vystihla podstatu výzvy.
- Pohotová poslušnosť: Dall-E 3 presne dodržiava pokyny.
- Mnohostranná kreativita: Môže zobrazovať viacero postáv na jednom obrázku.
- Integrácia textu: Dall-E 3 dokáže bezproblémovo integrovať text do obrázkov.
- Jasnosť obrazu: Niekedy vytvára obrázky s rozmazanými tvárami a očami.
- Konzistentnosť štýlu: Dall-E 3 dôsledne nereplikuje štýly konkrétnych umelcov.
- Správa obrázkov: Pri správe generovaných obrázkov na webovej lokalite Microsoft Bing existujú obmedzenia.
- Rýchlosť generácie: Proces generovania Dall-E 3 môže byť pomalší v porovnaní s inými modelmi AI.
Vylúčenie zodpovednosti
V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.
O autorovi
Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.
Ďalšie článkyDamir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu.