AI Wiki Umění Technika
Října 02, 2023

Dall-E 3 vs. Midjourney: Velké srovnání nejpokročilejších generátorů umění AI

Přidejte se k nám na této vzrušující cestě, když prozkoumáme Dall-E 3 a Midjourneyjemnosti, složitosti a nevyužitý potenciál. Tento článek zdůrazňuje nejzajímavější srovnání založená na výzkumu, který provedl nadšenec AI Atachkina; pokud se chcete dozvědět více, klikněte na https://trials.autocruitment.com.

Dall-E 3 vs. Midjourney: Velké srovnání nejpokročilejších generátorů umění AI
Pro tipy
1. Odkryjte 50 nejlepších výzev pro převod textu na obrázek pro generátory umění AI Midjourney a DALL-E.
2. Zažehněte svou kreativitu s Top 20 umělých generátorů umění převodu textu na obrázek z 2023.

Tento článek poskytuje výzvu k převodu textu na obrázek, obrázek zobrazující výsledky z Dall-E 3 a Midjourneya vysvětlení rozdílů mezi těmito dvěma generátory umění. Pojďme začít.

výzva: Kosmonaut stojí na Jupiteru a pozoruje východ slunce. futuristické rozhraní, perspektiva z první osoby, velitel vesmíru, dešťoměr a uživatelské rozhraní HUD Rise

Obě neuronové sítě si v tomto případě vedly obdivuhodně, s Midjourney mírně předčí ostatní.

výzva: natočeno Slimem Aaronsem z Wonder Woman v místnosti, složité vrstvy a textury, detailní design postav, pozadí s jasnými, rozmarnými a barevnými scénami, pastelová korekce barev jako ve filmech Wese Andersona, filmové zrno a Tokina AT-X 11-16mm f /2.8 pro dx ii

Dall-E 3 zde odvedl mnohem horší práci; získalo jasné barvy stylů, ale ne jasnost detailů; v pozadí se objevila zdeformovaná těla a tváře nebyly vůbec povedené.

výzva: obrázek roztomilého, baculatého cybercot v jeho online sídle
prompt: profesionální komerční studiové focení pro Nike; model s dlouhými vlasy; střela celého těla; na sobě béžové tričko Nike; neobvyklá džínová bunda Nike; měkká béžová plyšová taška nike; měkké fialové tenisky nike; stojící na světle růžovo-modrém pozadí; futuristické pozadí složitého aerodynamického tvaru s podsvícením; natočeno na Hasselblad X1D;

Obě místa se ukázala být zajímavá, ale Dall-E 3 se opět potýkal s tvářemi. Místo toho vyrobila plyšovou béžovou tašku podle pokynů ve výzvě a Midjourney ignoroval to. V tomto případě byl Dall-E 3 velmi poslušný při provádění výzvy.

pobídka: paprskem sledovaná bublinová postava v pastelových barvách, ženská socha s kovovým povrchem, lesklá/lesklá, zářivá turbulence, holubí jádro, nekonvenční pózy, anamorfní umění, iridescence/opalescence, smyčky zpětné vazby videa, lesklé oči, výrazné křivky, lesklý, tekutý figuratismus
výzva: vintage retro koláž superhrdinů, včetně Wonder Woman, Captain America, Batman a The Joker

A ještě jednou, zatímco obě mřížky vytvářejí vynikající koláže, Dall-E 3 je věrnější výzvě; přidalo to jen hrdiny, které jsme specifikovali, nemohlo se to proměnit v žolíka a zkřížilo to kapitána s Batmanem.

výzva: metalický ray tracing blob, anamorfní umění, poutavé detaily, precizní linie, výrazné křivky, lesklý, tekutý figuratismus, pastelové barvy, tmavé pozadí
výzva: Jednoduché vrstvy a textury, složitý design postav, živá, náladová a barevná pozadí, pastelová korekce barev podle filmů Wese Andersona, zrnitost filmu a objektiv Tokina at-x 11-16mm f/2.8 pro dx ii, to vše je přítomno na tomto obrázku Spider-Mana odpočívajícího na pohovce, který pořídil Slim Aarons.

Midjourney dokázal zkombinovat příslušné styly obou umělců z výzvy, zatímco Dall-E 3 jen přidal spoustu rušných detailů a jasných barev na pozadí.

výzva: Fotografie baculatých roztomilých tlustých koček z 80. let, které se zúčastnily hodiny aerobiku, zatímco měly sportovní zábavné leopardí legíny a růžové body, byla pořízena na Kodak Gold 200.

Opět jsou kočky ve špičkové formě a obě neuronové sítě dokonale rozumí filmovým kamerám. Dall-E 3 však snímkům dokonce dodává zrno.

1990. léta XNUMX. století hraje Leonardo DiCaprio mistra Jedi na ruské dači, zatímco třímá světelný meč a má na sobě pletený zelený svetr.

Dall-E 3 vytvořil mladého Leonarda DiCapria s cool jumper texturami, přidal filmovou zrnitost a barevné schéma a velmi chladně odrážel pocit ruské dači. Midjourney byl pro film dobrým barevným reflektorem a DiCaprio jí dal dospělejší vzhled.

výzva: koláž z Hvězdné války obrázky ve vintage retro stylu

I když oba neuronové sítě jsou zběhlí ve vytváření koláží, když se podíváte pozorně, Midjourney deformuje tváře a některé tvary objektů, zatímco Dall-E 3 je přesnější v provedení samotných postav – dokonce se ukázalo, že je to Chewbacca.

výzva: obrázek ruské gorgonské medúzy v oblečení Balenciaga hypebeast a procházející se po ulici na Manhattanu s hady za vlasy

Když si fotografie přiblížíte, všimnete si, že Dall-E 3 má rozmazané oči; Midjourney, na druhou stranu je bezchybný. Dall-E 3 předepsal také značku; hadi na hlavách se zdají být živější a v pohybu; Midjourney vždy je nutil ležet, spíše než na hlavě.

Výzva: Na této oceněné fotografii Slima Aaronse je pavoučí muž převlečený za vílu v růžových nadýchaných šatech a s kouzelnou hůlkou. Pořízeno fotoaparátem Fuji Superia X-TRA 800.

Oba jsou v pohodě, ale Midjourney zvážil styl umělce i efekt filmové kamery, zatímco Dall-E 3 ignoroval celovečerní záběr a nezohlednil jej.

výzva: víla SSSR s křídly a kostýmem astronauta

Také jsme se rozhodli otestovat fotku s vílami, ale Dall-E 3 tvrdošíjně odmítl spolupracovat. Midjourney neignoroval křídla, protože byl přidán odkaz s křídly. Když Dall-E 3 vyfotografoval snímek, nabídlo to několik zajímavých možností, ale s Američankou.

výzva: hlemýžď ​​pózující pro portrét v moderním hipsterském oděvu, 4K komplexní vrstvy a textury, detailní design postav a filmové zrno. Pozadí obsahuje živé, rozmarné a barevné scény.

Midjourney odvedli fantastickou práci, ale chceme upozornit na to, jak Dall-E 3 vytvořil filmové efekty na obrázku vpravo nahoře a přidal vlastní bílý rukopis; dopadlo to skvěle.

výzva: Spider-Man, Batman a Iron Man se sešli na pivu v baru.

Dall-E 3 dokázal velmi poslušně realizovat všechny hrdiny výzvy na jednom obrázku ještě jednou. Midjourney se velmi snažil a dokonce byl blízko úspěchu.

Výzva: Letní salát z rajčat a okurek, makro, plná scéna, teplé barvy, vysoce kvalitní fotorealistické hyperrealistické, přirozené osvětlení, Unreal Engine 5, color grading, redakční fotografie, fotografie, focení, Vysoký, epický, artgerm, foceno 70mm objektivem, Hloubka ostrosti, DOF, Tilt Blur, Rychlost závěrky 1/1000, F/22, Vyvážení bílé, 32k, Super-Resolution

Na první pohled se zdá, že oba jsou dobré, ale bližší zkoumání odhalí, že Dall-E 3 postrádá fotorealistický objem a že Midjourney zvládl klouby s vidlemi s třeskem.

výzva: McDonald's ve stylu nápaditých vesmírných scenérií s realistickými lidskými postavami, dvěma auty a traktorem s měsícem nad ním. Les Nasbis, Pierre Pellegrini, vědecky podložená, průkopnická odvážná saturace, firecore

Oba generátory jsou zběhlí ve svých oborech, přičemž Dall-E 3 vyniká v textu a Midjourney vynikají ve fotorealismu.

Fén BaByliss D570DE se používá v moderním interiéru s večerním osvětlením, industriálním designem a pastelovými barvami, ideální pro studiové focení.

Fyzika a geometrie fénů jsou náročné pro Midjourney. Můžete strávit spoustu času bojem s pokusy a referencemi a občas výsledky připomínají fén, ale Dall-E 3 přinesl přijatelný výsledek na první pokus a dokonce napsal text.

výzva: fotka jednooké Turangy Leely z futuramy

Jediné oko je dobré, ale to je jiný příběh. v Midjourney, napsali jsme negativní výzvu – žádná karikatura, ilustrace, plochá, dvě oči. Dall-E 3 okamžitě poslechla a udělala jedno oko, úsměv a klobouk dolů, ale rozhodně odmítla, aby ji někdo vyfotil.

Herec Brad Pitt je viděn v 1990. letech, jak zalévá záhony se zeleninou na ruské dači, zatímco má na sobě pruhované tílko a tepláky od adidasu. Scéna byla zachycena na Agfa Vista 400.

Midjourney generace neměla ráda Brada, takže jsme použili extra službu Insight face Swap dát Bradovu tvář generaci; byl tu o tom příspěvek. Dall-E 3 ví, kdo je Brad Pitt, a umí kreslit hvězdy bez dalšího softwaru.

výzva: krásná dívka, jednorožci, jablečné technologie a retro retro koláž galaxií

Obě sítě jsou dobré, ale Dall-E 3 dokáže vytvořit rohy jednorožce Midjourney obvykle nemůže.

výzva: zmrzlina v ruce, sportovní oblečení nike a úžasný fantazijní elf sedící vedle orka na fotce ulice.

Dall-E 3 odvedl dobrou práci při uvedení postav do akce; můžeme vidět orka a elfa s elfíma ušima. Je tam také člověk v teplákové soupravě Nike, ale má rozmazané oči. Elfí špičaté uši jsou většinou ignorovány Midjourneya Nike je také ignorován.

výzva: kresba víly SSSR oblečené jako astronaut

Když byla postscriptová „ilustrace“ zpočátku z výzvy vynechána, Dall-E 3 ji vytvořil. Pak jsme se rozhodli to porovnat Midjourneyilustrace. Zatímco Midjourney Dall-E 3, který se více podobal ilustracím ze sovětské éry a neobsahoval vílí křídla, odvedl fantastickou práci při kreslení srpu a kladiva. Příklad vpravo ukazuje, jak by se Dall-E 3 mohl objevit v textu.

výzva: Dača na Jupiteru, v dálce jsou vidět orbitální prstence planety, mimozemšťan vaří gril, složité návrhy postav, jasná, bláznivá a barevná pozadí, pastelová korekce barev a la filmy Wese Andersona, filmové zrno a Tokina AT -X 11-16mm f/2.8 Pro dX II objektiv

Nicméně, Midjourney přešel do fotorealismu; na obrázcích není hlavní postava, jen okolí, ale i tak pohoda. Dall-E 3 nechtěl být znovu na fotce.

výzva: filmové zrno, psí žrádlo, složitý design postav, vrstvy a textury, jasné, bláznivé a barevné scény na pozadí a pastelové korekce barev jako ve filmu Wese Andersona

Dall-E 3 vs. Midjourney: Výhody a nevýhody

Jak uživatelé tuto technologii prozkoumávají, vyšlo najevo několik pozoruhodných silných stránek a omezení, což přináší další pohled na její funkčnost.

Klady:

  1. Pohotová poslušnost: Jednou z výjimečných vlastností Dall-E 3 je jeho pozoruhodná schopnost přesně sledovat výzvy. Uživatelé uvedli, že model AI efektivně reaguje na širokou škálu vstupů, což z něj činí všestranný nástroj pro různé úkoly.
  2. Mnohostranná kreativita: Dall-E 3 prokazuje schopnost zobrazit více postav v rámci jednoho obrazu, čímž rozšiřuje svůj potenciál pro vyprávění a kreativní projekty. Tento mnohostranný přístup zvyšuje jeho užitečnost v různých doménách.
  3. Integrace textu: Uživatelé si všimli odbornosti Dall-E 3 v bezproblémové integraci textu do obrázků. Tato funkce usnadňuje vytváření vizuálně poutavého obsahu s vloženými textovými prvky.

Nevýhody:

  1. Jasnost obrázku: Významným omezením je tendence AI vytvářet obrázky s rozmazanými obličeji a očima. I když vyniká kreativitou, někdy postrádá jasnost a přesnost, kterou lze vidět u obsahu vytvořeného lidmi.
  2. Konzistence stylu: Dall-E 3 důsledně nereplikuje styly konkrétních umělců, což může být nevýhodou pro ty, kteří hledají přesnou uměleckou emulaci.
  3. Požadavek na VPN: Přístup k Dall-E 3 v současné době vyžaduje použití VPN, což může pro některé uživatele představovat problémy s dostupností.
  4. Správa obrázků: Uživatelé narazili na omezení při správě generovaných obrázků na webu Microsoft Bing. Je pozoruhodné, že zde není žádná funkce orientace formátu a historie obrázků je omezena na nedávno nahraná data, což vyžaduje okamžité zkopírování pro pozdější použití.
  5. Rychlost generování: V některých případech se uvádí, že proces generování v Dall-E 3 je pomalejší ve srovnání s jinými modely AI.

Navzdory těmto omezením má Dall-E 3 značný příslib. Uživatelé i odborníci si uvědomují jeho potenciál způsobit revoluci ve vytváření obsahu a vyprávění příběhů. Tak jako OpenAI pokračuje ve zdokonalování a rozšiřování své nabídky, očekává se, že silné stránky Dall-E 3 zazáří ještě jasněji, což z něj udělá cenný nástroj v různých oblastech.

Nejčastější dotazy

Oba Dall-E 3 a Midjourney mají své silné a slabé stránky. Dall-E 3 je pozoruhodně poslušný výzev a dokáže bez problémů integrovat text do obrázků. Někdy však vytváří obrázky s rozmazanými tvářemi a očima a nemusí konzistentně kopírovat styly konkrétních umělců. Na druhou stranu, Midjourney vyniká ve fotorealismu, ale nemusí vždy zachytit podstatu určitých podnětů tak přesně jako Dall-E 3.

Článek poskytuje výzvy k převodu textu na obrázek a ukazuje výsledky z Dall-E 3 a Midjourneya vysvětluje rozdíly mezi těmito dvěma generátory umění.

Oba modely AI mají své silné a slabé stránky. Například ve výzvě o vesmírném muži na Jupiteru, Midjourney mírně předčil Dall-E 3. V další výzvě o Wonder Woman však Dall-E 3 přesněji vystihl podstatu výzvy.

  • Pohotová poslušnost: Dall-E 3 přesně dodržuje pokyny.
  • Mnohostranná kreativita: Může zobrazovat více znaků v jednom obrázku.
  • Integrace textu: Dall-E 3 dokáže bez problémů integrovat text do obrázků.
  • Jasnost obrazu: Někdy vytváří snímky s rozmazanými tvářemi a očima.
  • Konzistence stylu: Dall-E 3 důsledně nereplikuje styly konkrétních umělců.
  • Správa obrazu: Při správě generovaných obrázků na webu Microsoft Bing existují omezení.
  • Rychlost generace: Proces generování Dall-E 3 může být ve srovnání s jinými modely AI pomalejší.

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Hot Stories
Připojte se k našemu zpravodaji.
Novinky

Od zvlnění k velké zelené DAO: Jak kryptoměnové projekty přispívají k charitě

Pojďme prozkoumat iniciativy využívající potenciál digitálních měn pro charitativní účely.

Vědět více

AlphaFold 3, Med-Gemini a další: The Way AI Transforms Healthcare in 2024

Umělá inteligence se ve zdravotnictví projevuje různými způsoby, od odhalování nových genetických korelací až po posílení robotických chirurgických systémů...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Pyth Network zavádí Pull Oracle na Solana a umožňuje vývojářům přístup k cenám Oracle
Novinky Technika
Pyth Network zavádí Pull Oracle na Solana a umožňuje vývojářům přístup k cenám Oracle
Června 17, 2024
Aethir's AI and Gaming Partners To Airdrop Tokeny do svých držitelů kontrolních uzlů
Featured Novinky Technika
Aethir's AI and Gaming Partners To Airdrop Tokeny do svých držitelů kontrolních uzlů
Června 17, 2024
Společnost Notional Finance plně ukončí podporu V2 do konce července, vyzývá uživatele, aby přešli na V3
Novinky Technika
Společnost Notional Finance plně ukončí podporu V2 do konce července, vyzývá uživatele, aby přešli na V3
Června 17, 2024
Tether spouští Alloy platformu podporovanou Tether Gold a představuje první token aUSD₮
Trhy Novinky Technika
Tether spouští Alloy platformu podporovanou Tether Gold a představuje první token aUSD₮
Června 17, 2024
CRYPTOMERIA LABS PTE. LTD.