Dall-E 3 vs. Midjourney: O mare comparație a celor mai avansate generatoare de artă AI
Alăturați-vă nouă în această călătorie palpitantă în timp ce explorăm Dall-E 3 și Midjourneysubtilitățile, complexitățile și potențialul neexploatat. Acest articol evidențiază cele mai interesante comparații bazate pe cercetările efectuate de pasionatul AI Atachkina; dacă sunteți interesat să aflați mai multe, faceți clic pe legătură.
Pro Sfaturi |
---|
1. Descoperiți Top 50 de solicitări text-to-image pentru AI Art Generators Midjourney și DALL-E. |
2. Aprindeți-vă creativitatea cu Top 20 de generatoare de artă text-to-image AI din 2023. |
Acest articol oferă un prompt text-to-image, o imagine care arată rezultatele de la Dall-E 3 și Midjourney, și o explicație a diferențelor dintre cele două generatoare de artă. Sa incepem.
Ambele rețele neuronale au funcționat admirabil în acest caz, cu Midjourney depășindu-le ușor pe celelalte.
Dall-E 3 a făcut o treabă mult mai proastă aici; a primit culorile strălucitoare ale stilurilor, dar nu și claritatea detaliilor; în fundal au apărut corpuri deformate, iar fețele nu au avut deloc succes.
S-a dovedit a fi interesant ambele locuri, dar Dall-E 3 s-a luptat încă o dată cu fețele. În schimb, a făcut o geantă bej de pluș, conform instrucțiunilor din prompt și Midjourney l-a desconsiderat. În acest caz, Dall-E 3 a fost foarte ascultător în îndeplinirea promptului.
Și încă o dată, în timp ce ambele grile fac colaje excelente, Dall-E 3 este mai fidel promptului; a adăugat doar eroii pe care i-am specificat, nu se putea transforma într-un glumeț și l-a încrucișat pe căpitan cu Batman.
Midjourney a reușit să combine stilurile respective ale celor doi artiști de la prompt, în timp ce Dall-E 3 a adăugat o mulțime de detalii ocupate și culori strălucitoare pe fundal.
Încă o dată, pisicile sunt în formă maximă, iar ambele rețele neuronale înțeleg perfect camerele cu film. Cu toate acestea, Dall-E 3 adaugă chiar și cereale imaginilor.
Dall-E 3 a creat un tânăr Leonardo DiCaprio cu texturi de jumper cool, a adăugat granul filmului și o schemă de culori și a reflectat foarte rece senzația unei daci rusești. Midjourney a fost un bun reflector de culoare pentru film, iar DiCaprio i-a oferit o apariție mai matură.
Deși ambele rețele neuronale sunt adepți în crearea de colaje, dacă te uiți cu atenție, Midjourney distorsionează fețele și unele forme de obiecte, în timp ce Dall-E 3 este mai precis în execuția personajelor în sine — chiar s-a dovedit a fi Chewbacca.
Când măriți fotografiile, veți observa că Dall-E 3 are ochii încețoșați; Midjourney, pe de altă parte, este impecabil. Dall-E 3 a prescris și o marcă; șerpii de pe capete par a fi mai vii și în mișcare; Midjourney i-a făcut mereu întinși, mai degrabă decât pe cap.
Ambele sunt cool, dar Midjourney a luat în considerare stilul artistului, precum și efectul unei camere cu film, în timp ce Dall-E 3 a ignorat fotografia în lungime completă și nu a luat-o în considerare.
Am luat și decizia de a testa o fotografie cu zâne, dar Dall-E 3 a refuzat cu obstinație să coopereze. Midjourney nu a ignorat aripile pentru că fusese adăugată referința cu aripi. Când Dall-E 3 a făcut o poză, a oferit câteva posibilități interesante, dar cu o americancă.
Midjourney a făcut o treabă fantastică, dar vrem să atragem o atenție deosebită asupra modului în care Dall-E 3 a creat efectele filmului în imaginea din dreapta sus și a adăugat propriul scris de mână alb; a ieșit grozav.
Dall-E 3 a reușit să realizeze cu foarte multă ascultare toți eroii promptului într-o singură imagine încă o dată. Midjourney a încercat foarte mult și chiar a fost aproape de a reuși.
La prima vedere, se pare că ambele sunt bune, dar o examinare mai atentă arată că lui Dall-E 3 îi lipsește volumul fotorealist și că Midjourney mânuit articulațiile cu furci cu o bubuitură.
Ambele generatoare sunt competente în domeniile lor respective, Dall-E 3 excelând în text și Midjourney excelând în fotorealism.
Fizica și geometria uscătoarelor de păr sunt dificile pentru Midjourney. Puteți petrece mult timp luptându-vă cu încercări și referințe, iar ocazional rezultatele seamănă cu un uscător de păr, dar Dall-E 3 a produs un rezultat acceptabil la prima încercare și chiar a scris textul.
Singurul ochi este bun, dar asta e altă poveste. În Midjourney, am scris un prompt negativ – fără desen animat, ilustrație, plat, doi ochi. Dall-E 3 s-a supus imediat și a făcut un ochi, un zâmbet și pălăria jos, dar a refuzat categoric să lase pe cineva să-i facă poza.
Midjourney a făcut ca generația să nu cadă pe Brad, așa că am folosit serviciul suplimentar Insight Faceți schimb să pună chipul lui Brad pe generație; a fost o postare despre asta aici. Dall-E 3 știe cine este Brad Pitt și poate desena stele fără niciun software suplimentar.
Ambele ochiuri sunt bune, dar Dall-E 3 poate crea coarne de unicorn în timp ce Midjourney de obicei nu poate.
Dall-E 3 a făcut o treabă bună în a pune personajele în acțiune; putem vedea un orc și un elf cu urechi de spiriduș. Există și o persoană care poartă un trening Nike, dar are ochii pătați. Urechile ascuțite de elfi sunt în mare parte ignorate de Midjourney, iar Nike este, de asemenea, ignorată.
Când „ilustrația” postscriptă a fost inițial lăsată în afara promptului, Dall-E 3 a creat una. Am decis apoi să o comparăm cu Midjourneyilustrația lui. In timp ce Midjourney semăna mai mult cu ilustrațiile din epoca sovietică și nu includea aripile de zână, Dall-E 3 a făcut o treabă fantastică desenând secera și ciocanul. Exemplul din dreapta arată cum ar putea apărea Dall-E 3 în text.
"Dar daca Midjourney a intrat în fotorealism; nu există un personaj principal în imagini, doar împrejurimile, dar totuși cool. Dall-E 3 nu a vrut să apară din nou în fotografie.
Dall-E 3 vs. Midjourney: Pro și contra
Pe măsură ce utilizatorii explorează această tehnologie, mai multe puncte forte și limitări notabile au ieșit la iveală, oferind mai multe informații despre funcționalitatea acesteia.
Pro-uri:
- Supunere promptă: Una dintre caracteristicile remarcabile ale lui Dall-E 3 este capacitatea sa remarcabilă de a urma cu precizie instrucțiunile. Utilizatorii au raportat că modelul AI răspunde eficient la o gamă largă de intrări, făcându-l un instrument versatil pentru diverse sarcini.
- Creativitate cu mai multe fațete: Dall-E 3 prezintă capacitatea de a descrie mai multe personaje într-o singură imagine, extinzându-și potențialul pentru povestiri și proiecte creative. Această abordare cu mai multe fațete își îmbunătățește utilitatea în diferite domenii.
- Integrarea textului: Utilizatorii au remarcat competența Dall-E 3 în integrarea perfectă a textului în imagini. Această caracteristică facilitează crearea de conținut atractiv din punct de vedere vizual, cu elemente textuale încorporate.
Contra:
- Claritatea imaginii: O limitare notabilă este tendința AI de a produce imagini cu fețe și ochi încețoșați. Deși excelează în creativitate, uneori îi lipsește claritatea și precizia văzute în conținutul generat de oameni.
- Consecvența stilului: Dall-E 3 nu reproduce în mod constant stilurile anumitor artiști, ceea ce poate fi un dezavantaj pentru cei care caută o emulare artistică precisă.
- Cerință VPN: Accesul la Dall-E 3 necesită în prezent utilizarea unui VPN, ceea ce poate pune probleme de accesibilitate pentru unii utilizatori.
- Managementul imaginii: Utilizatorii s-au confruntat cu limitări atunci când gestionează imaginile generate pe site-ul web Microsoft Bing. În special, nu există nicio funcție de orientare a formatului, iar istoricul imaginilor este limitat la încărcări recente, necesitând copierea imediată pentru utilizare ulterioară.
- Viteza de generare: În unele cazuri, procesul de generare în Dall-E 3 a fost raportat a fi mai lent în comparație cu alte modele AI.
În ciuda acestor limitări, Dall-E 3 este promițător substanțial. Utilizatorii și experții recunosc deopotrivă potențialul său de a revoluționa crearea de conținut și povestirea. La fel de OpenAI continuă să-și rafineze și să-și extindă ofertele, este de așteptat ca punctele forte ale lui Dall-E 3 să strălucească și mai puternic, făcându-l un instrument valoros în diverse domenii.
Întrebări frecvente
Atât Dall-E 3 cât și Midjourney au punctele lor forte și slabe. Dall-E 3 este în mod deosebit ascultător de solicitări și poate integra textul fără probleme în imagini. Cu toate acestea, uneori produce imagini cu fețe și ochi încețoșați și este posibil să nu reproducă în mod constant stilurile anumitor artiști. Pe de altă parte, Midjourney excelează în fotorealism, dar este posibil să nu surprindă întotdeauna esența anumitor indicații la fel de precis ca Dall-E 3.
Articolul oferă instrucțiuni text-to-image, prezentând rezultatele atât de la Dall-E 3, cât și de la Midjourney, și explică diferențele dintre cele două generatoare de artă.
Ambele modele AI au punctele lor forte și punctele slabe. De exemplu, într-un mesaj despre un astronau pe Jupiter, Midjourney a depășit ușor Dall-E 3. Cu toate acestea, într-un alt prompt despre Wonder Woman, Dall-E 3 a fost mai precis în a surprinde esența promptului.
- Supunere promptă: Dall-E 3 urmează cu exactitate instrucțiunile.
- Creativitate cu mai multe fațete: Poate reprezenta mai multe personaje într-o singură imagine.
- Integrarea textului: Dall-E 3 poate integra perfect textul în imagini.
- Claritatea imaginii: Uneori produce imagini cu fețe și ochi încețoșați.
- Consecvența stilului: Dall-E 3 nu reproduce în mod constant stilurile anumitor artiști.
- Managementul imaginii: Există limitări la gestionarea imaginilor generate pe site-ul web Microsoft Bing.
- Viteza de generare: Procesul de generare al lui Dall-E 3 poate fi mai lent în comparație cu alte modele AI.
Declinare a responsabilităţii
În conformitate cu Ghidurile proiectului Trust, vă rugăm să rețineți că informațiile furnizate pe această pagină nu sunt destinate și nu trebuie interpretate ca fiind consiliere juridică, fiscală, investițională, financiară sau orice altă formă de consiliere. Este important să investești doar ceea ce îți poți permite să pierzi și să cauți sfaturi financiare independente dacă ai îndoieli. Pentru informații suplimentare, vă sugerăm să consultați termenii și condițiile, precum și paginile de ajutor și asistență furnizate de emitent sau agent de publicitate. MetaversePost se angajează să raporteze corecte, imparțial, dar condițiile de piață pot fi modificate fără notificare.
Despre autor
Damir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.
Mai multe articoleDamir este liderul echipei, manager de produs și editor la Metaverse Post, care acoperă subiecte precum AI/ML, AGI, LLM-uri, Metaverse și Web3-domenii conexe. Articolele sale atrag o audiență masivă de peste un milion de utilizatori în fiecare lună. El pare a fi un expert cu 10 ani de experiență în SEO și marketing digital. Damir a fost menționat în Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto și alte publicații. Călătorește între Emiratele Arabe Unite, Turcia, Rusia și CSI ca nomad digital. Damir a obținut o diplomă de licență în fizică, despre care crede că i-a oferit abilitățile de gândire critică necesare pentru a avea succes în peisajul în continuă schimbare al internetului.