AI Wiki Művészet Technológia
Október 02, 2023

Dall-E 3 vs. Midjourney: A legfejlettebb AI művészeti generátorok nagy összehasonlítása

Csatlakozzon hozzánk ezen az izgalmas utazáson, miközben felfedezzük a Dall-E 3-at és Midjourneyfinomságait, bonyolultságait és kiaknázatlan lehetőségeit. Ez a cikk kiemeli a legérdekesebb összehasonlításokat az AI-rajongó Atachkina kutatása alapján; Ha többet szeretne megtudni, kattintson a link.

Dall-E 3 vs. Midjourney: A legfejlettebb AI művészeti generátorok nagy összehasonlítása
Pro tippek
1. Fedezze fel a Az 50 legjobb szöveg-képre vonatkozó felszólítás az AI Art Generatorok számára Midjourney és DALL-E.
2. Gyújtsa meg kreativitását a A 20 legjobb mesterséges intelligencia szöveg-kép művészetgenerátor A 2023.

Ez a cikk egy szöveg-képre váltást tartalmaz, egy képet, amely a Dall-E 3 eredményeit mutatja és Midjourney, valamint a kettő közötti különbségek magyarázata művészeti generátorok. Kezdjük.

felszólítás: Egy űrhajós áll a Jupiteren, és a napfelkeltét figyeli. futurisztikus felület, első személyű perspektíva, térparancsnok, esőmérő és HUD Rise UI

Mindkét neurális hálózat csodálatosan teljesített ebben az esetben, a Midjourney kissé felülmúlja a többit.

prompt: Slim Aarons of Wonder Woman felvétele a szobában, összetett rétegek és textúrák, részletes karaktertervezés, háttér világos, szeszélyes és színes jelenetekkel, pasztell színkorrekció, mint a Wes Anderson filmekben, filmszemcsék és Tokina AT-X 11-16mm f /2.8 pro dx ii

A Dall-E 3 itt sokkal rosszabb munkát végzett; megkapta a stílusok élénk színeit, de nem a részletek tisztaságát; torz testek jelentek meg a háttérben, és az arcok egyáltalán nem jártak sikerrel.

prompt: kép egy aranyos, pufók kiságyról az online rezidenciájában
prompt: professzionális kereskedelmi stúdiófotózás a Nike számára; hosszú hajú modell; teljes test lövés; bézs Nike pólót visel; szokatlan Nike farmer kabát; puha bézs plüss nike táska; puha lila nike tornacipő; világos rózsaszín-kék alapon állva; összetett, áramvonalas forma futurisztikus háttere háttérvilágítással; Hasselblad X1D-n lőtték;

Mindkét hely érdekesnek bizonyult, de a Dall-E 3 ismét megküzdött az arcokkal. Ehelyett egy plüss bézs táskát készített a felszólításnak megfelelően, és Midjourney figyelmen kívül hagyta. Ebben az esetben a Dall-E 3 nagyon engedelmes volt a felszólítás végrehajtásában.

prompt: sugárnyomos buborékfigura pasztell színekben, női szobor fémes bevonattal, fényes/fényes, élénk turbulencia, galambmag, nem szokványos pózok, anamorf művészet, irizáló/opaleszcencia, video-visszacsatoló hurkok, fényes szemek, merész ívek, fényes, figuratizmus
prompt: egy szüreti retro kollázs szuperhősökről, köztük a Wonder Womanről, Amerika Kapitányról, Batmanről és A Jokerről

És még egyszer, miközben mindkét rács kiváló kollázsokat készít, a Dall-E 3 hűbb a felszólításhoz; csak az általunk meghatározott hősöket adta hozzá, nem tudott jokerré válni, és keresztbe tette a kapitányt Batmannel.

prompt: fémes sugárkövető folt, anamorf művészet, szemet gyönyörködtető részletek, precíziós vonalak, merész ívek, fényes, folyékony figuratizmus, pasztell színek, sötét háttér
prompt: Egyszerű rétegek és textúrák, bonyolult karaktertervezés, élénk, szeszélyes és színes hátterek, pasztell színkorrekció a Wes Anderson filmekhez, filmszemcsék és Tokina at-x 11-16mm f/2.8 pro dx ii objektív. ezen a Slim Aarons által készített képen, amelyen Pókember pihen a kanapén.

Midjourney képes volt kombinálni a két művész stílusát a promptból, míg a Dall-E 3 csak sok mozgalmas részletet és élénk színeket adott a háttérhez.

prompt: A 80-as évek fényképe a Kodak Gold 200-on készült pufók, aranyos kövér macskákról egy aerobikórán, miközben mulatságos leopárd leggingset és rózsaszín bodyt viselnek.

A macskák ismét csúcsformában vannak, és mindkét neurális hálózat tökéletesen felfogja a filmes kamerákat. A Dall-E 3 azonban még gabonát is ad a képekhez.

Az 1990-es években Leonardo DiCaprio egy Jedi mestert alakít egy orosz dachán, miközben fénykarddal hadonászik, és zöld kötött pulóvert visel.

A Dall-E 3 egy fiatal Leonardo DiCapriót hozott létre hűvös jumper textúrákkal, hozzáadott filmszemcsékkel és színsémával, és nagyon hűvösen tükrözte az orosz dacha hangulatát. Midjourney jó színvisszaverő volt a filmhez, és DiCaprio érettebb külsőt adott neki.

prompt: a kollázs Csillagok háborúja képek egy vintage retro stílusban

Bár mindkettő neurális hálózatok ügyesen készítenek kollázsokat, ha alaposan megnézed, Midjourney eltorzítja az arcokat és néhány tárgyformát, míg a Dall-E 3 pontosabb a karakterek kivitelezésében – még az is kiderült, hogy Chewbacca.

prompt: egy kép egy orosz gorgon medusáról, aki Balenciaga hypebeast utcai ruhát visel, és kígyókkal sétál Manhattanben

Ha ráközelít a fényképekre, észreveheti, hogy a Dall-E 3 szemei ​​homályosak; Midjourney, viszont hibátlan. A Dall-E 3 márkát is írt elő; a fejeken lévő kígyók élőbbnek és mozgásban lévőnek tűnnek; Midjourney mindig inkább feküdt, nem pedig a fején.

Felszólítás: Slim Aarons ezen a díjnyertes fényképén egy tündérnek álcázott pókember látható, aki rózsaszín bolyhos ruhát visel, és varázspálcát tart a kezében. Fuji Superia X-TRA 800 kamerával készült.

Mindkettő klassz, de Midjourney figyelembe vette a művész stílusát és a filmes kamera hatását, míg a Dall-E 3 figyelmen kívül hagyta a teljes hosszúságú felvételt, és nem vette figyelembe.

prompt: Szovjetunió tündér szárnyakkal és űrhajós jelmeztel

Azt is elhatároztuk, hogy tündérekkel tesztelünk egy fotót, de a Dall-E 3 makacsul megtagadta az együttműködést. Midjourney nem hagyta figyelmen kívül a szárnyakat, mert hozzáadták a szárnyakkal való hivatkozást. Amikor a Dall-E 3 fényképet készített, érdekes lehetőségeket kínált, de egy amerikai nővel.

prompt: egy portréhoz pózoló csiga kortárs hipszter öltözékben, 4K összetett rétegekkel és textúrákkal, részletgazdag karaktertervezéssel és filmszemcsékkel. A háttér élénk, szeszélyes és színes jeleneteket tartalmaz.

Midjourney fantasztikus munkát végzett, de szeretnénk külön felhívni a figyelmet arra, hogy a Dall-E 3 hogyan hozta létre a filmeffektusokat a jobb felső képen, és saját fehér kézírást adott hozzá; remekül sikerült.

felszólítás: Pókember, Batman és Vasember összejöttek egy sörre egy bárban.

A Dall-E 3 még egyszer nagyon engedelmesen képes volt egyetlen képen megvalósítani a prompt összes hősét. Midjourney nagyon keményen próbálkozott, és közel járt a sikerhez.

Prompt: Nyári saláta paradicsomból és uborkából, makró, teljes jelenet, meleg színek, kiváló minőségű fotorealisztikus hiperrealista, természetes megvilágítás, Unreal Engine 5, színbesorolás, szerkesztői fotózás, fotózás, fotózás, magas, epikus, artgerm, felvétel 70 mm-es objektívvel, mélységélesség, DOF, elmosódás dönthető, zársebesség 1/1000, F/22, fehéregyensúly, 32k, szuper felbontás

Első pillantásra úgy tűnik, hogy mindkettő jó, de közelebbről megvizsgálva kiderül, hogy a Dall-E 3-ból hiányzik a fotorealisztikus hangerő, és Midjourney csattanva kezelte az illesztéseket villákkal.

prompt: egy McDonald's fantáziadús űrképek stílusában valósághű emberi alakokkal, két autóval és egy traktorral, felette egy holddal. Les Nasbis, Pierre Pellegrini, tudományos alapú, úttörő merész telítettség, tűzmag

Mindkét generátor jártas a saját területén, a Dall-E 3 pedig a szövegben és a Midjourney kiváló a fotorealizmusban.

A BaByliss D570DE hajszárítót modern belső térben használják esti világítással, ipari dizájnnal és pasztell színekkel, tökéletes stúdiófotózáshoz.

A hajszárítók fizikája és geometriája nehézkes Midjourney. Sok időt eltölthet próbálkozásokkal és referenciákkal küszködve, és időnként az eredmény egy hajszárítóhoz hasonlít, de a Dall-E 3 már első próbálkozásra elfogadható eredményt hozott, és még a szöveget is megírta.

prompt: a félszemű Turanga Leela fotója a futuramából

Az egyetlen szem jó, de ez egy másik történet. Ban ben Midjourney, negatív promptot írtunk – nincs rajzfilm, illusztráció, lapos, két szem. A Dall-E 3 azonnal engedelmeskedett, és egyik szemét mosolyra húzta és le a kalappal, de határozottan nem engedte, hogy bárki lefényképezze.

Brad Pitt színész az 1990-es években látható, amint egy orosz nyaraló veteményeskert ágyait öntözi, miközben csíkos felsőt és Adidas melegítőnadrágot visel. A jelenetet az Agfa Vista 400 rögzítette.

Midjourney nem kedvelte meg a generációt Braddel, ezért az Insight extra szolgáltatást vettük igénybe Face Swap hogy Brad arcát a generációra helyezze; itt volt róla bejegyzés. A Dall-E 3 tudja, ki az a Brad Pitt, és további szoftverek nélkül is tud sztárokat rajzolni.

prompt: egy gyönyörű lány, egyszarvúak, alma technológiák és galaxisok retro kollázsa

Mindkét háló jó, de a Dall-E 3 egyszarvú szarvokat készíthet közben Midjourney jellemzően nem tud.

prompt: fagylalt a kézben, nike sportruházat és egy lenyűgöző fantáziamanó, aki egy ork mellett ül egy utcai fotón.

A Dall-E 3 jó munkát végzett a karakterek mozgásba hozásával; láthatunk egy orkot és egy manófülű manót. Van egy Nike tréningruhát viselő személy is, de a szeme elkenődött. Az elf hegyes füleket többnyire figyelmen kívül hagyják Midjourney, és a Nike-t is figyelmen kívül hagyják.

prompt: rajz a Szovjetunió űrhajósnak öltözött tündéréről

Amikor az utóirat „illusztráció” kezdetben kimaradt a promptból, a Dall-E 3 készített egyet. Aztán úgy döntöttünk, hogy összehasonlítjuk Midjourneyillusztrációja. Míg Midjourney jobban hasonlított a szovjet kori illusztrációkra, és nem tartalmazta a tündérszárnyakat, a Dall-E 3 fantasztikus munkát végzett a sarló és kalapács megrajzolásával. A jobb oldali példa azt mutatja, hogyan jelenhet meg a Dall-E 3 a szövegben.

prompt: Egy dacha a Jupiteren, a bolygó keringési gyűrűi láthatók a távolban, egy földönkívüli grillezést süt, bonyolult karaktertervek, világos, szokatlan és színes hátterek, pasztell színkorrekció a Wes Anderson filmekben, filmszemcsék és egy Tokina AT -X 11-16mm f/2.8 Pro dX II objektív

Azonban, Midjourney bement a fotorealizmusba; a képeken nincs főszereplő, csak a környezet, de azért menő. A Dall-E 3 nem akart újra a képen szerepelni.

prompt: filmszemcsék, kutyaeledel, bonyolult karakterdizájn, rétegek és textúrák, világos, szokatlan és színes jelenetek a háttérben és pasztell színkorrekció, mint egy Wes Anderson filmben

Dall-E 3 vs. Midjourney: Érvek és ellenérvek

Ahogy a felhasználók felfedezik ezt a technológiát, több figyelemre méltó erősségre és korlátra is fény derült, ami további betekintést enged a funkcionalitásába.

Előnyök:

  1. Azonnali engedelmesség: A Dall-E 3 egyik kiemelkedő tulajdonsága a figyelemre méltó képessége az utasítások pontos követésére. A felhasználók arról számoltak be, hogy az AI modell hatékonyan reagál a bemenetek széles skálájára, így sokoldalú eszköz a különféle feladatokhoz.
  2. Sokoldalú kreativitás: A Dall-E 3 képes több karaktert egyetlen képen belül ábrázolni, kibővítve a történetmesélés és a kreatív projektek lehetőségeit. Ez a sokrétű megközelítés növeli annak hasznosságát a különböző területeken.
  3. Szövegintegráció: A felhasználók észrevették a Dall-E 3 jártasságát a szöveg zökkenőmentes képekbe való integrálása terén. Ez a funkció megkönnyíti a vizuálisan vonzó tartalom létrehozását beágyazott szöveges elemekkel.

Hátrányok:

  1. A kép tisztasága: Figyelemre méltó korlátja az AI-nak az a tendenciája, hogy homályos arccal és szemmel készít képeket. Bár a kreativitásban kitűnik, néha hiányzik belőle az ember által generált tartalmaknál tapasztalható tisztaság és pontosság.
  2. A stílus konzisztenciája: A Dall-E 3 nem másolja következetesen bizonyos művészek stílusait, ami hátrány lehet azok számára, akik precíz művészi emulációt keresnek.
  3. VPN követelmény: A Dall-E 3-hoz való hozzáférés jelenleg VPN használatát teszi szükségessé, ami egyes felhasználók számára akadálymentesítési kihívásokat jelenthet.
  4. Képkezelés: A felhasználók korlátozásokba ütköztek a Microsoft Bing webhelyen generált képek kezelése során. Figyelemre méltó, hogy nincs formátumorientációs funkció, és a képelőzmények a legutóbbi feltöltésekre korlátozódnak, ezért azonnali másolás szükséges a későbbi felhasználáshoz.
  5. Generációs sebesség: Egyes esetekben a Dall-E 3 generálási folyamata lassabb, mint más AI-modelleknél.

E korlátozások ellenére a Dall-E 3 komoly ígéreteket rejt magában. A felhasználók és a szakértők egyaránt felismerik, hogy forradalmasíthatja a tartalomkészítést és a történetmesélést. Mint OpenAI Továbbra is finomítja és bővíti kínálatát, várhatóan a Dall-E 3 erősségei még fényesebben fognak ragyogni, így számos területen értékes eszközzé válik.

GYIK

Mind a Dall-E 3, mind a Midjourney megvannak a maguk erősségei és gyengeségei. A Dall-E 3 kifejezetten engedelmeskedik a felszólításoknak, és zökkenőmentesen képes a szöveget képekbe integrálni. Néha azonban elmosódott arcú és szemű képeket készít, és előfordulhat, hogy nem reprodukálja következetesen bizonyos művészek stílusait. Másrészről, Midjourney kiemelkedik a fotorealizmusban, de előfordulhat, hogy nem mindig ragad meg olyan pontosan bizonyos felszólítások lényegét, mint a Dall-E 3.

A cikk szöveges képre késztető üzeneteket tartalmaz, amelyek bemutatják a Dall-E 3 és a Dall-E XNUMX eredményeit. Midjourney, és elmagyarázza a két művészetgenerátor közötti különbségeket.

Mindkét AI-modellnek megvannak a maga erősségei és gyengeségei. Például egy űrhajósról szóló üzenetben a Jupiteren, Midjourney enyhén felülmúlta a Dall-E 3-at. A Wonder Womanről szóló másik promptban azonban a Dall-E 3 pontosabban ragadta meg a prompt lényegét.

  • Gyors engedelmesség: A Dall-E 3 pontosan követi az utasításokat.
  • Sokoldalú kreativitás: Egy képen több karaktert is ábrázolhat.
  • Szövegintegráció: A Dall-E 3 zökkenőmentesen képes szöveget képekbe integrálni.
  • Képtisztaság: Néha elmosódott arcú és szemű képeket készít.
  • A stílus konzisztenciája: A Dall-E 3 nem másolja következetesen bizonyos művészek stílusait.
  • Képkezelés: Vannak korlátozások a Microsoft Bing webhelyen generált képek kezelésére.
  • Generációs sebesség: A Dall-E 3 generálási folyamata lassabb lehet más AI modellekhez képest.

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

A volatilitás közepette nő az intézményi étvágy a Bitcoin ETF-ek felé

A 13F bejelentéseken keresztül közzétett információk jelentős intézményi befektetőket tárnak fel a Bitcoin ETF-ek iránt, ami alátámasztja a ...

Tudjon meg többet

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
A Nexo elindítja a „vadászatot”, hogy a felhasználókat 12 millió dolláros NEXO tokennel jutalmazza az ökoszisztéma iránti elkötelezettségért
piacok Tudósítást Technológia
A Nexo elindítja a „vadászatot”, hogy a felhasználókat 12 millió dolláros NEXO tokennel jutalmazza az ökoszisztéma iránti elkötelezettségért
May 8, 2024
A Revolut Revolut X Exchange Woos Crypto Traders szolgáltatása nulla gyártói díjjal és fejlett elemzéssel
piacok szoftver Történetek és vélemények Technológia
A Revolut Revolut X Exchange Woos Crypto Traders szolgáltatása nulla gyártói díjjal és fejlett elemzéssel
May 8, 2024
A Lisk hivatalosan áttér az Ethereum Layer 2-re, és bemutatja a Core v4.0.6-ot
Tudósítást Technológia
A Lisk hivatalosan áttér az Ethereum Layer 2-re, és bemutatja a Core v4.0.6-ot
May 8, 2024
2024. májusi új mémérmék: 7 válogatás kriptorajongók számára
megemészteni piacok Technológia
2024. májusi új mémérmék: 7 válogatás kriptorajongók számára
May 8, 2024
CRYPTOMERIA LABS PTE. KFT.