AI Wiki Artă Tehnologia
Octombrie 02, 2023

Dall-E 3 vs. Midjourney: O mare comparație a celor mai avansate generatoare de artă AI

Alăturați-vă nouă în această călătorie palpitantă în timp ce explorăm Dall-E 3 și Midjourneysubtilitățile, complexitățile și potențialul neexploatat. Acest articol evidențiază cele mai interesante comparații bazate pe cercetările efectuate de pasionatul AI Atachkina; dacă sunteți interesat să aflați mai multe, faceți clic pe legătură.

Dall-E 3 vs. Midjourney: O mare comparație a celor mai avansate generatoare de artă AI
Pro Sfaturi
1. Descoperiți Top 50 de solicitări text-to-image pentru AI Art Generators Midjourney și DALL-E.
2. Aprindeți-vă creativitatea cu Top 20 de generatoare de artă text-to-image AI din 2023.

Acest articol oferă un prompt text-to-image, o imagine care arată rezultatele de la Dall-E 3 și Midjourney, și o explicație a diferențelor dintre cele două generatoare de artă. Sa incepem.

prompt: Un om spațial stă pe Jupiter și observă răsăritul. interfață futuristă, perspectivă la persoana întâi, comandant spațial, pluviometru și interfață de utilizare HUD Rise

Ambele rețele neuronale au funcționat admirabil în acest caz, cu Midjourney depășindu-le ușor pe celelalte.

prompt: filmat de Slim Aarons din Wonder Woman în cameră, straturi și texturi complexe, design detaliat al personajelor, fundal cu scene strălucitoare, capricioase și colorate, corecție a culorilor pastelate precum filmele cu Wes Anderson, granulație a filmului și Tokina AT-X 11-16 mm f /2.8 pro dx ii

Dall-E 3 a făcut o treabă mult mai proastă aici; a primit culorile strălucitoare ale stilurilor, dar nu și claritatea detaliilor; în fundal au apărut corpuri deformate, iar fețele nu au avut deloc succes.

prompt: poza unui cyberpatuț drăguț și dolofan în reședința sa online
prompt: fotografie profesională de studio comercial pentru Nike; model cu părul lung; lovitură de corp întreg; purtând un tricou Nike bej; jachetă de denim Nike neobișnuită; geantă Nike moale bej de pluș; adidași Nike violet moi; stând pe fundal roz-albastru deschis; fundal futurist al unei forme complexe simplificate cu iluminare de fundal; împușcat pe Hasselblad X1D;

S-a dovedit a fi interesant ambele locuri, dar Dall-E 3 s-a luptat încă o dată cu fețele. În schimb, a făcut o geantă bej de pluș, conform instrucțiunilor din prompt și Midjourney l-a desconsiderat. În acest caz, Dall-E 3 a fost foarte ascultător în îndeplinirea promptului.

prompt: figură cu bule trasate cu raze în culori pastelate, sculptură feminină cu finisaje metalice, strălucitoare/lucioasă, turbulență vibrantă, miez de porumbei, ipostaze neconvenționale, artă anamorfică, irizare/opalescență, bucle de feedback video, ochi strălucitori, curbe îndrăznețe, strălucitor, figuratism fluid
prompt: un colaj retro de epocă de supereroi, inclusiv Wonder Woman, Căpitanul America, Batman și Joker

Și încă o dată, în timp ce ambele grile fac colaje excelente, Dall-E 3 este mai fidel promptului; a adăugat doar eroii pe care i-am specificat, nu se putea transforma într-un glumeț și l-a încrucișat pe căpitan cu Batman.

prompt: blob metalic de urmărire a razei, artă anamorfică, detalii atrăgătoare, linii precise, curbe îndrăznețe, strălucitoare, figuratism fluid, culori pastelate, fundal închis
prompt: straturi și texturi simple, design complicat al caracterelor, fundaluri vii, capricioase și colorate, corecție a culorilor pastelate la filmele cu Wes Anderson, granulație a filmului și un obiectiv Tokina at-x 11-16 mm f/2.8 pro dx ii sunt toate prezente în această imagine a lui Spider-Man relaxându-se pe o canapea luată de Slim Aarons.

Midjourney a reușit să combine stilurile respective ale celor doi artiști de la prompt, în timp ce Dall-E 3 a adăugat o mulțime de detalii ocupate și culori strălucitoare pe fundal.

prompt: o fotografie din anii '80 cu pisici grase și dolofane, drăguțe, care participă la un curs de aerobic în timp ce purtau jambiere distractive leopard și body roz, a fost făcută pe Kodak Gold 200.

Încă o dată, pisicile sunt în formă maximă, iar ambele rețele neuronale înțeleg perfect camerele cu film. Cu toate acestea, Dall-E 3 adaugă chiar și cereale imaginilor.

Anii 1990, Leonardo DiCaprio joacă rolul unui maestru Jedi pe o dacha rusească în timp ce mânuiește o sabie laser și poartă un pulover verde tricotat.

Dall-E 3 a creat un tânăr Leonardo DiCaprio cu texturi de jumper cool, a adăugat granul filmului și o schemă de culori și a reflectat foarte rece senzația unei daci rusești. Midjourney a fost un bun reflector de culoare pentru film, iar DiCaprio i-a oferit o apariție mai matură.

prompt: un colaj de Razboiul Stelelor imagini într-un stil retro vintage

Deși ambele rețele neuronale sunt adepți în crearea de colaje, dacă te uiți cu atenție, Midjourney distorsionează fețele și unele forme de obiecte, în timp ce Dall-E 3 este mai precis în execuția personajelor în sine — chiar s-a dovedit a fi Chewbacca.

prompt: o fotografie cu o gorgonă rusă medusa purtând haine de stradă Balenciaga hypebeast și plimbându-se pe o stradă din Manhattan cu șerpi pentru păr

Când măriți fotografiile, veți observa că Dall-E 3 are ochii încețoșați; Midjourney, pe de altă parte, este impecabil. Dall-E 3 a prescris și o marcă; șerpii de pe capete par a fi mai vii și în mișcare; Midjourney i-a făcut mereu întinși, mai degrabă decât pe cap.

Prompt: Această fotografie premiată de Slim Aarons prezintă un om păianjen deghizat într-o zână purtând o rochie pufoasă roz și ținând o baghetă magică. A fost realizată cu o cameră Fuji Superia X-TRA 800.

Ambele sunt cool, dar Midjourney a luat în considerare stilul artistului, precum și efectul unei camere cu film, în timp ce Dall-E 3 a ignorat fotografia în lungime completă și nu a luat-o în considerare.

prompt: zână URSS cu aripi și costum de astronaut

Am luat și decizia de a testa o fotografie cu zâne, dar Dall-E 3 a refuzat cu obstinație să coopereze. Midjourney nu a ignorat aripile pentru că fusese adăugată referința cu aripi. Când Dall-E 3 a făcut o poză, a oferit câteva posibilități interesante, dar cu o americancă.

prompt: un melc care pozează pentru un portret în timp ce poartă ținute hipster contemporane, straturi și texturi complexe 4K, design detaliat al personajelor și granulație a filmului. Fundalul prezintă scene vibrante, capricioase și colorate.

Midjourney a făcut o treabă fantastică, dar vrem să atragem o atenție deosebită asupra modului în care Dall-E 3 a creat efectele filmului în imaginea din dreapta sus și a adăugat propriul scris de mână alb; a ieșit grozav.

prompt: Spider-Man, Batman și Iron Man s-au adunat la o bere la un bar.

Dall-E 3 a reușit să realizeze cu foarte multă ascultare toți eroii promptului într-o singură imagine încă o dată. Midjourney a încercat foarte mult și chiar a fost aproape de a reuși.

Prompt: Salată de vară de roșii și castraveți, macro, scenă plină, culori calde, hiperrealist fotorealistic de înaltă calitate, iluminare naturală, 5 Unreal Engine, gradare de culoare, fotografie editorială, fotografie, ședință foto, înalt, epic, artgerm, fotografiere cu un obiectiv de 70 mm, adâncime de câmp, DOF, înclinare estompare, viteză obturator 1/1000, F/22, balans de alb, 32k, super-rezoluție

La prima vedere, se pare că ambele sunt bune, dar o examinare mai atentă arată că lui Dall-E 3 îi lipsește volumul fotorealist și că Midjourney mânuit articulațiile cu furci cu o bubuitură.

prompt: un McDonald's în stilul peisajelor spațiale imaginative cu figuri umane realiste, două mașini și un tractor, cu o lună deasupra. Les Nasbis, Pierre Pellegrini, bazat pe știință, pionierat în saturație îndrăzneață, firecore

Ambele generatoare sunt competente în domeniile lor respective, Dall-E 3 excelând în text și Midjourney excelând în fotorealism.

Uscătorul de păr BaByliss D570DE este folosit într-un interior modern cu iluminat de seară, design industrial și culori pastelate, perfect pentru o ședință de studio.

Fizica și geometria uscătoarelor de păr sunt dificile pentru Midjourney. Puteți petrece mult timp luptându-vă cu încercări și referințe, iar ocazional rezultatele seamănă cu un uscător de păr, dar Dall-E 3 a produs un rezultat acceptabil la prima încercare și chiar a scris textul.

prompt: fotografia cu Turanga Leela cu un ochi de la Futurama

Singurul ochi este bun, dar asta e altă poveste. În Midjourney, am scris un prompt negativ – fără desen animat, ilustrație, plat, doi ochi. Dall-E 3 s-a supus imediat și a făcut un ochi, un zâmbet și pălăria jos, dar a refuzat categoric să lase pe cineva să-i facă poza.

Actorul Brad Pitt este văzut în anii 1990 udând paturile grădinii de legume pe o dacha rusească în timp ce poartă maieu cu dungi și pantaloni de trening de la adidas. Scena a fost surprinsă pe Agfa Vista 400.

Midjourney a făcut ca generația să nu cadă pe Brad, așa că am folosit serviciul suplimentar Insight Faceți schimb să pună chipul lui Brad pe generație; a fost o postare despre asta aici. Dall-E 3 știe cine este Brad Pitt și poate desena stele fără niciun software suplimentar.

prompt: o fată frumoasă, unicorni, tehnologii Apple și un colaj retro vintage de galaxii

Ambele ochiuri sunt bune, dar Dall-E 3 poate crea coarne de unicorn în timp ce Midjourney de obicei nu poate.

prompt: înghețată în mână, îmbrăcăminte sport Nike și un elf fantastic uluitor stând lângă un orc într-o fotografie de stradă.

Dall-E 3 a făcut o treabă bună în a pune personajele în acțiune; putem vedea un orc și un elf cu urechi de spiriduș. Există și o persoană care poartă un trening Nike, dar are ochii pătați. Urechile ascuțite de elfi sunt în mare parte ignorate de Midjourney, iar Nike este, de asemenea, ignorată.

prompt: desen al unei zâne URSS îmbrăcată în astronaut

Când „ilustrația” postscriptă a fost inițial lăsată în afara promptului, Dall-E 3 a creat una. Am decis apoi să o comparăm cu Midjourneyilustrația lui. In timp ce Midjourney semăna mai mult cu ilustrațiile din epoca sovietică și nu includea aripile de zână, Dall-E 3 a făcut o treabă fantastică desenând secera și ciocanul. Exemplul din dreapta arată cum ar putea apărea Dall-E 3 în text.

prompt: O dacha pe Jupiter, inelele orbitale ale planetei pot fi văzute în depărtare, un extraterestru gătește un grătar, desene complicate ale personajelor, fundaluri strălucitoare, ciudate și colorate, corecție a culorilor pastelate la filmele Wes Anderson, granulație de film și un Tokina AT -Obiectiv X 11-16 mm f/2.8 Pro dX II

"Dar daca Midjourney a intrat în fotorealism; nu există un personaj principal în imagini, doar împrejurimile, dar totuși cool. Dall-E 3 nu a vrut să apară din nou în fotografie.

prompt: cereale de film, mâncare pentru câini, design complicat al personajelor, straturi și texturi, scene luminoase, ciudate și colorate în fundal și corecție a culorilor pastelate ca într-un film cu Wes Anderson

Dall-E 3 vs. Midjourney: Pro și contra

Pe măsură ce utilizatorii explorează această tehnologie, mai multe puncte forte și limitări notabile au ieșit la iveală, oferind mai multe informații despre funcționalitatea acesteia.

Pro-uri:

  1. Supunere promptă: Una dintre caracteristicile remarcabile ale lui Dall-E 3 este capacitatea sa remarcabilă de a urma cu precizie instrucțiunile. Utilizatorii au raportat că modelul AI răspunde eficient la o gamă largă de intrări, făcându-l un instrument versatil pentru diverse sarcini.
  2. Creativitate cu mai multe fațete: Dall-E 3 prezintă capacitatea de a descrie mai multe personaje într-o singură imagine, extinzându-și potențialul pentru povestiri și proiecte creative. Această abordare cu mai multe fațete își îmbunătățește utilitatea în diferite domenii.
  3. Integrarea textului: Utilizatorii au remarcat competența Dall-E 3 în integrarea perfectă a textului în imagini. Această caracteristică facilitează crearea de conținut atractiv din punct de vedere vizual, cu elemente textuale încorporate.

Contra:

  1. Claritatea imaginii: O limitare notabilă este tendința AI de a produce imagini cu fețe și ochi încețoșați. Deși excelează în creativitate, uneori îi lipsește claritatea și precizia văzute în conținutul generat de oameni.
  2. Consecvența stilului: Dall-E 3 nu reproduce în mod constant stilurile anumitor artiști, ceea ce poate fi un dezavantaj pentru cei care caută o emulare artistică precisă.
  3. Cerință VPN: Accesul la Dall-E 3 necesită în prezent utilizarea unui VPN, ceea ce poate pune probleme de accesibilitate pentru unii utilizatori.
  4. Managementul imaginii: Utilizatorii s-au confruntat cu limitări atunci când gestionează imaginile generate pe site-ul web Microsoft Bing. În special, nu există nicio funcție de orientare a formatului, iar istoricul imaginilor este limitat la încărcări recente, necesitând copierea imediată pentru utilizare ulterioară.
  5. Viteza de generare: În unele cazuri, procesul de generare în Dall-E 3 a fost raportat a fi mai lent în comparație cu alte modele AI.

În ciuda acestor limitări, Dall-E 3 este promițător substanțial. Utilizatorii și experții recunosc deopotrivă potențialul său de a revoluționa crearea de conținut și povestirea. La fel de OpenAI continuă să-și rafineze și să-și extindă ofertele, este de așteptat ca punctele forte ale lui Dall-E 3 să strălucească și mai puternic, făcându-l un instrument valoros în diverse domenii.

Întrebări frecvente

Atât Dall-E 3 cât și Midjourney au punctele lor forte și slabe. Dall-E 3 este în mod deosebit ascultător de solicitări și poate integra textul fără probleme în imagini. Cu toate acestea, uneori produce imagini cu fețe și ochi încețoșați și este posibil să nu reproducă în mod constant stilurile anumitor artiști. Pe de altă parte, Midjourney excelează în fotorealism, dar este posibil să nu surprindă întotdeauna esența anumitor indicații la fel de precis ca Dall-E 3.

Articolul oferă instrucțiuni text-to-image, prezentând rezultatele atât de la Dall-E 3, cât și de la Midjourney, și explică diferențele dintre cele două generatoare de artă.

Ambele modele AI au punctele lor forte și punctele slabe. De exemplu, într-un mesaj despre un astronau pe Jupiter, Midjourney a depășit ușor Dall-E 3. Cu toate acestea, într-un alt prompt despre Wonder Woman, Dall-E 3 a fost mai precis în a surprinde esența promptului.

  • Supunere promptă: Dall-E 3 urmează cu exactitate instrucțiunile.
  • Creativitate cu mai multe fațete: Poate reprezenta mai multe personaje într-o singură imagine.
  • Integrarea textului: Dall-E 3 poate integra perfect textul în imagini.
  • Claritatea imaginii: Uneori produce imagini cu fețe și ochi încețoșați.
  • Consecvența stilului: Dall-E 3 nu reproduce în mod constant stilurile anumitor artiști.
  • Managementul imaginii: Există limitări la gestionarea imaginilor generate pe site-ul web Microsoft Bing.
  • Viteza de generare: Procesul de generare al lui Dall-E 3 poate fi mai lent în comparație cu alte modele AI.

Declinare a responsabilităţii

În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.

Despre autor

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Mai multe articole
Damir Yalalov
Damir Yalalov

Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului. 

Hot Stories
Alăturați-vă Newsletter-ului nostru.
Ultimele ştiri

De la Ripple la Big Green DAO: Cum contribuie proiectele de criptomonede la caritate

Să explorăm inițiativele care valorifică potențialul monedelor digitale pentru cauze caritabile.

Aflați mai multe

AlphaFold 3, Med-Gemini și alții: modul în care AI transformă asistența medicală în 2024

Inteligența artificială se manifestă în diferite moduri în asistența medicală, de la descoperirea de noi corelații genetice până la abilitarea sistemelor chirurgicale robotizate...

Aflați mai multe
Alăturați-vă comunității noastre tehnologice inovatoare
Citeste mai mult
Află mai multe
Crypto Exchange Kraken a fost șantajat după raportarea recompenselor de eroare, 3 milioane de dolari retrase din activele trezoreriei
Buletin de stiri Tehnologia
Crypto Exchange Kraken a fost șantajat după raportarea recompenselor de eroare, 3 milioane de dolari retrase din activele trezoreriei
19 Iunie, 2024
Pendle asigură Arbitrum STIP Bridge Grant și intenționează să aloce 1 milion de recompense ARB furnizorilor de lichidități Arbitrum
pieţe Buletin de stiri Tehnologia
Pendle asigură Arbitrum STIP Bridge Grant și intenționează să aloce 1 milion de recompense ARB furnizorilor de lichidități Arbitrum
19 Iunie, 2024
Conectarea rețelelor blockchain: cum ERC-7683 își propune să transforme schimburile și tranzacțiile în lanțuri încrucișate
Opinie pieţe Software Tehnologia
Conectarea rețelelor blockchain: cum ERC-7683 își propune să transforme schimburile și tranzacțiile în lanțuri încrucișate
19 Iunie, 2024
Lido lansează adoptarea timpurie pentru modulul de miză comunitară pentru a-i integra pe stakers solo înainte de lansarea sa generală
Buletin de stiri Tehnologia
Lido lansează adoptarea timpurie pentru modulul de miză comunitară pentru a-i integra pe stakers solo înainte de lansarea sa generală
19 Iunie, 2024
CRYPTOMERIA LABS PTE. LTD.