AI Wiki Arte Tecnologia
Ottobre 02, 2023

Dall-E 3 vs. Midjourney: Un grande confronto tra i generatori di arte AI più avanzati

Unisciti a noi in questo emozionante viaggio mentre esploriamo Dall-E 3 e Midjourneyle sottigliezze, le complessità e il potenziale non sfruttato. Questo articolo evidenzia i confronti più intriganti basati sulla ricerca condotta dall'entusiasta dell'intelligenza artificiale Atachkina; se sei interessato a saperne di più, clicca su link.

Dall-E 3 vs. Midjourney: Un grande confronto tra i generatori di arte AI più avanzati
Suggerimenti Pro
1. Scopri il I 50 principali suggerimenti da testo a immagine per generatori di arte AI Midjourney e DALL-E.
2. Accendi la tua creatività con I 20 migliori generatori di arte da testo a immagine AI di 2023.

Questo articolo fornisce un prompt di conversione del testo in immagine, un'immagine che mostra i risultati di Dall-E 3 e Midjourneye una spiegazione delle differenze tra i due generatori d'arte. Cominciamo.

suggerimento: Un astronauta si trova su Giove e osserva l'alba. interfaccia futuristica, prospettiva in prima persona, comandante spaziale, pluviometro e interfaccia utente HUD Rise

Entrambe le reti neurali hanno funzionato egregiamente in questo caso, con il Midjourney leggermente surclassando gli altri.

suggerimento: girato da Slim Aarons di Wonder Woman nella stanza, strati e texture complessi, design dettagliato dei personaggi, sfondo con scene luminose, stravaganti e colorate, correzione del colore pastello come i film di Wes Anderson, grana della pellicola e Tokina AT-X 11-16mm f /2.8 pro dx ii

Dall-E 3 ha fatto un lavoro molto peggiore qui; ha ottenuto i colori vivaci degli stili, ma non la chiarezza dei dettagli; sullo sfondo apparivano corpi deformi e i volti non riuscivano affatto.

suggerimento: foto di un cybercot carino e paffuto nella sua residenza online
suggerimento: fotografia professionale in studio commerciale per Nike; modella con capelli lunghi; ripresa a corpo intero; indossa una maglietta Nike beige; insolita giacca di jeans Nike; morbida borsa Nike in peluche beige; morbide scarpe da ginnastica Nike viola; in piedi su sfondo rosa-blu chiaro; sfondo futuristico di una forma aerodinamica complessa con retroilluminazione; girato con Hasselblad X1D;

Entrambi i posti si sono rivelati interessanti, ma Dall-E 3 ancora una volta ha lottato con le pareti. Invece, ha realizzato una morbida borsa beige come indicato nel prompt, e Midjourney lo ignorò. In questo caso, Dall-E 3 è stato molto obbediente nell'eseguire la richiesta.

suggerimento: figura a bolla con ray tracing in colori pastello, scultura femminile con finiture metalliche, lucido/lucido, turbolenza vibrante, piccione, pose non convenzionali, arte anamorfica, iridescenza/opalescenza, cicli di feedback video, occhi lucenti, curve audaci, figuratismo lucido e fluido
suggerimento: un collage retrò vintage di supereroi, tra cui Wonder Woman, Capitan America, Batman e The Joker

E ancora una volta, mentre entrambe le griglie realizzano ottimi collage, Dall-E 3 è più fedele alla guida; aggiungeva solo gli eroi da noi specificati, non poteva trasformarsi in un jolly e incrociava il capitano con Batman.

suggerimento: blob metallico di ray tracing, arte anamorfica, dettagli accattivanti, linee precise, curve audaci, figuratismo lucido e fluido, colori pastello, sfondo scuro
suggerimento: sono presenti livelli e texture semplici, design intricato dei personaggi, sfondi vividi, stravaganti e colorati, correzione del colore pastello alla maniera dei film di Wes Anderson, grana della pellicola e un obiettivo Tokina at-x 11-16mm f/2.8 pro dx ii in questa immagine di Spider-Man che si rilassa su un divano scattata da Slim Aarons.

Midjourney è stato in grado di combinare i rispettivi stili dei due artisti dal prompt, mentre Dall-E 3 ha semplicemente aggiunto molti dettagli vivaci e colori vivaci allo sfondo.

suggerimento: La fotografia degli anni '80 di gatti grassi e paffuti che partecipano a una lezione di aerobica mentre indossano divertenti leggings leopardati e body rosa è stata scattata su Kodak Gold 200.

Ancora una volta i gatti sono in ottima forma ed entrambe le reti neurali comprendono perfettamente le cineprese. Tuttavia, Dall-E 3 aggiunge grana alle immagini.

Anni '1990, Leonardo DiCaprio interpreta un maestro Jedi in una dacia russa mentre brandisce una spada laser e indossa un maglione verde lavorato a maglia.

Dall-E 3 ha creato un giovane Leonardo DiCaprio con fantastiche texture di maglione, ha aggiunto la grana della pellicola e una combinazione di colori e riflette in modo molto bello l'atmosfera di una dacia russa. Midjourney era un buon riflettore di colori per il film e DiCaprio le ha dato un aspetto più maturo.

suggerimento: un collage di Star Wars immagini in stile retrò vintage

Sebbene entrambi reti neurali sono abili nel creare collage, se guardi da vicino, Midjourney distorce i volti e la forma di alcuni oggetti, mentre Dall-E 3 è più accurato nell'esecuzione dei personaggi stessi: si è scoperto che era addirittura Chewbecca.

suggerimento: una foto di una gorgone medusa russa che indossa lo streetwear hypebeast di Balenciaga e passeggia per una strada di Manhattan con serpenti al posto dei capelli

Quando ingrandisci le fotografie, noterai che Dall-E 3 ha gli occhi sfocati; Midjourney, d'altra parte, è impeccabile. Dall-E 3 prescriveva anche un marchio; i serpenti sulle teste sembrano più vivi e in movimento; Midjourney li facevano sempre sdraiati, anziché sulla testa.

Suggerimento: questa pluripremiata fotografia di Slim Aarons presenta un uomo ragno travestito da fata che indossa un soffice vestito rosa e tiene in mano una bacchetta magica. È stata scattata con una fotocamera Fuji Superia X-TRA 800.

Entrambi sono fantastici, ma Midjourney considerava lo stile dell'artista così come l'effetto di una macchina da presa, mentre Dall-E 3 ignorava l'inquadratura a figura intera e non la considerava.

suggerimento: fata dell'URSS con ali e costume da astronauta

Abbiamo anche deciso di provare una foto con le fate, ma Dall-E 3 si è ostinatamente rifiutato di collaborare. Midjourney non ha ignorato le ali perché era stato aggiunto il riferimento alle ali. Quando Dall-E 3 ha scattato una foto, ha offerto alcune possibilità intriganti, ma con una donna americana.

suggerimento: una lumaca in posa per un ritratto mentre indossa abiti hipster contemporanei, strati e texture complessi 4K, design dettagliato dei personaggi e grana della pellicola. Lo sfondo presenta scene vivaci, stravaganti e colorate.

Midjourney ha fatto un lavoro fantastico, ma vogliamo attirare l'attenzione in particolare su come Dall-E 3 ha creato gli effetti cinematografici nell'immagine in alto a destra e ha aggiunto la propria calligrafia bianca; si è rivelato fantastico.

suggerimento: Spider-Man, Batman e Iron Man si sono incontrati per una birra in un bar.

Dall-E 3 è riuscito a rappresentare ancora una volta tutti gli eroi del prompt in un'immagine con molta obbedienza. Midjourney ci ho provato molto e sono arrivato anche vicino al successo.

Suggerimento: insalata estiva di pomodori e cetrioli, macro, scena intera, colori caldi, fotorealismo iperrealistico di alta qualità, illuminazione naturale, Unreal Engine 5, classificazione del colore, fotografia editoriale, fotografia, servizio fotografico, Alto, epico, artgerm, scattato con un obiettivo da 70 mm, Profondità di campo, DOF, Sfocatura inclinata, Velocità dell'otturatore 1/1000, F/22, Bilanciamento del bianco, 32k, Super risoluzione

A prima vista, sembra che entrambi siano buoni, ma un esame più attento rivela che il Dall-E 3 manca di volume fotorealistico e che Midjourney ha maneggiato le articolazioni con le forchette con il botto.

suggerimento: un McDonald's nello stile di fantasiosi paesaggi spaziali con figure umane realistiche, due automobili e un trattore, con la luna sopra. Les Nasbis, Pierre Pellegrini, basato sulla scienza, pionieristico, audace saturazione, firecore

Entrambi i generatori sono esperti nei rispettivi campi, con Dall-E 3 che eccelle nel testo e Midjourney eccellendo nel fotorealismo.

L'asciugacapelli BaByliss D570DE viene utilizzato in interni moderni con illuminazione serale, design industriale e colori pastello, perfetti per le riprese in studio.

La fisica e la geometria degli asciugacapelli sono difficili Midjourney. Puoi passare molto tempo a lottare con tentativi e riferimenti, e occasionalmente i risultati assomigliano a un asciugacapelli, ma Dall-E 3 ha prodotto un risultato accettabile al primo tentativo e ha persino scritto il testo.

suggerimento: foto di Turanga Leela con un occhio solo da futurama

L'unico occhio è buono, ma questa è un'altra storia. In Midjourney, abbiamo scritto un messaggio negativo: niente vignetta, illustrazione, piatto, due occhi. Dall-E 3 obbedì immediatamente e fece un occhio, un sorriso e un cappello, ma si rifiutò categoricamente di farsi fotografare.

L'attore Brad Pitt viene visto negli anni '1990 mentre annaffiava l'orto di una dacia russa mentre indossava una canottiera a righe e pantaloni della tuta adidas. La scena è stata catturata con Agfa Vista 400.

Midjourney ha reso la generazione diversa da Brad, quindi abbiamo utilizzato il servizio extra Insight Cambia faccia mettere la faccia di Brad sulla generazione; c'era un post a riguardo qui. Dall-E 3 sa chi è Brad Pitt e può disegnare stelle senza software aggiuntivo.

suggerimento: una bellissima ragazza, unicorni, tecnologie Apple e un collage retrò vintage di galassie

Entrambe le mesh sono buone, ma Dall-E 3 può creare corna di unicorno Midjourney in genere non può.

suggerimento: gelato in mano, abbigliamento sportivo Nike e uno splendido elfo fantasy seduto accanto a un orco in una foto di strada.

Dall-E 3 ha fatto un buon lavoro nel mettere in azione i personaggi; possiamo vedere un orco e un elfo con orecchie da elfo. C'è anche una persona che indossa una tuta Nike, ma ha gli occhi sporchi. Le orecchie a punta degli elfi vengono per lo più ignorate Midjourney, e anche Nike non viene presa in considerazione.

suggerimento: disegno di una fata dell'URSS vestita da astronauta

Quando il postscript “illustrazione” è stato inizialmente lasciato fuori dal prompt, Dall-E 3 ne ha creato uno. Abbiamo quindi deciso di confrontarlo con Midjourneyl'illustrazione. Mentre Midjourney assomigliava più da vicino alle illustrazioni dell'era sovietica e non includeva le ali delle fate, Dall-E 3 ha fatto un lavoro fantastico disegnando la falce e il martello. L'esempio a destra mostra come potrebbe apparire Dall-E 3 nel testo.

suggerimento: una dacia su Giove, gli anelli orbitali del pianeta possono essere visti in lontananza, un alieno cucina un barbecue, intricati disegni dei personaggi, sfondi luminosi, stravaganti e colorati, correzione del colore pastello alla Wes Anderson film, grana della pellicola e un Tokina AT -Obiettivo X 11-16mm f/2.8 Pro dX II

Però, i Midjourney è entrato nel fotorealismo; non c'è nessun personaggio principale nelle immagini, solo l'ambiente circostante, ma comunque bello. Dall-E 3 non voleva essere più nella foto.

suggerimento: grana della pellicola, cibo per cani, design intricato dei personaggi, strati e trame, scene luminose, stravaganti e colorate sullo sfondo e correzione del colore pastello come in un film di Wes Anderson

Dall-E 3 vs. Midjourney: Pro e contro

Man mano che gli utenti esplorano questa tecnologia, sono emersi numerosi punti di forza e limitazioni degni di nota, fornendo ulteriori informazioni sulla sua funzionalità.

PRO:

  1. Pronta obbedienza: Una delle caratteristiche distintive di Dall-E 3 è la sua straordinaria capacità di seguire accuratamente le istruzioni. Gli utenti hanno riferito che il modello di intelligenza artificiale risponde in modo efficace a un’ampia gamma di input, rendendolo uno strumento versatile per vari compiti.
  2. Creatività multiforme: Dall-E 3 mostra la capacità di rappresentare più personaggi all'interno di un'unica immagine, espandendo il suo potenziale per la narrazione e i progetti creativi. Questo approccio sfaccettato migliora la sua utilità in diversi domini.
  3. Integrazione del testo: Gli utenti hanno notato la competenza di Dall-E 3 nell'integrare perfettamente il testo nelle immagini. Questa funzionalità facilita la creazione di contenuti visivamente accattivanti con elementi testuali incorporati.

Contro:

  1. Chiarezza dell'immagine: Una limitazione notevole è la tendenza dell'intelligenza artificiale a produrre immagini con volti e occhi sfocati. Sebbene eccelle nella creatività, a volte manca della chiarezza e della precisione riscontrate nei contenuti generati dagli esseri umani.
  2. Coerenza dello stile: Dall-E 3 non replica in modo coerente gli stili di artisti specifici, il che può rappresentare uno svantaggio per chi cerca una precisa emulazione artistica.
  3. Requisito VPN: L'accesso a Dall-E 3 attualmente richiede l'uso di una VPN, il che potrebbe comportare problemi di accessibilità per alcuni utenti.
  4. Gestione delle immagini: Gli utenti hanno riscontrato limitazioni durante la gestione delle immagini generate sul sito Web Microsoft Bing. In particolare, non esiste una funzione di orientamento del formato e la cronologia delle immagini è limitata ai caricamenti recenti, richiedendo una copia immediata per un uso successivo.
  5. Velocità di generazione: In alcuni casi, è stato segnalato che il processo di generazione in Dall-E 3 è più lento rispetto ad altri modelli di intelligenza artificiale.

Nonostante queste limitazioni, Dall-E 3 mantiene una promessa sostanziale. Sia gli utenti che gli esperti ne riconoscono il potenziale per rivoluzionare la creazione di contenuti e la narrazione. COME OpenAI continua a perfezionare ed espandere la propria offerta, si prevede che i punti di forza di Dall-E 3 brilleranno ancora di più, rendendolo uno strumento prezioso in vari campi.

FAQ

Sia Dall-E 3 che Midjourney hanno i loro punti di forza e di debolezza. Dall-E 3 è particolarmente obbediente alle istruzioni e può integrare perfettamente il testo nelle immagini. Tuttavia, a volte produce immagini con volti e occhi sfocati e potrebbe non replicare in modo coerente gli stili di artisti specifici. D'altra parte, Midjourney eccelle nel fotorealismo ma potrebbe non catturare sempre l'essenza di alcuni suggerimenti con la stessa precisione di Dall-E 3.

L'articolo fornisce istruzioni da testo a immagine, mostrando i risultati sia di Dall-E 3 che Midjourney, e spiega le differenze tra i due generatori di arte.

Entrambi i modelli di intelligenza artificiale hanno i loro punti di forza e di debolezza. Ad esempio, in un messaggio su un astronauta su Giove, Midjourney ha leggermente sovraperformato Dall-E 3. Tuttavia, in un altro suggerimento su Wonder Woman, Dall-E 3 è stato più accurato nel catturare l'essenza del suggerimento.

  • Pronta obbedienza: Dall-E 3 segue accuratamente le istruzioni.
  • Creatività multiforme: Può rappresentare più personaggi in un'unica immagine.
  • Integrazione del testo: Dall-E 3 può integrare perfettamente il testo nelle immagini.
  • Chiarezza dell'immagine: A volte produce immagini con volti e occhi sfocati.
  • Coerenza di stile: Dall-E 3 non replica in modo coerente gli stili di artisti specifici.
  • Gestione delle immagini: Esistono limitazioni nella gestione delle immagini generate sul sito Web Microsoft Bing.
  • Velocità di generazione: Il processo di generazione di Dall-E 3 può essere più lento rispetto ad altri modelli IA.

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Cresce l’appetito istituzionale verso gli ETF Bitcoin in un contesto di volatilità

Le informazioni fornite tramite la documentazione 13F rivelano importanti investitori istituzionali che si dilettano negli ETF Bitcoin, sottolineando una crescente accettazione di...

Per saperne di più

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Nexo avvia "The Hunt" per premiare gli utenti con 12 milioni di dollari in token NEXO per essersi impegnati con il suo ecosistema
Mercati Notizie Tecnologia
Nexo avvia "The Hunt" per premiare gli utenti con 12 milioni di dollari in token NEXO per essersi impegnati con il suo ecosistema
8 Maggio 2024
L'exchange Revolut X di Revolut corteggia i trader di criptovalute con zero commissioni per i creatori e analisi avanzate
Mercati Software Storie e recensioni Tecnologia
L'exchange Revolut X di Revolut corteggia i trader di criptovalute con zero commissioni per i creatori e analisi avanzate
8 Maggio 2024
Lisk passa ufficialmente al livello 2 di Ethereum e svela il core v4.0.6
Notizie Tecnologia
Lisk passa ufficialmente al livello 2 di Ethereum e svela il core v4.0.6
8 Maggio 2024
Nuove monete meme di maggio 2024: 7 scelte per i fan delle criptovalute
digerire Mercati Tecnologia
Nuove monete meme di maggio 2024: 7 scelte per i fan delle criptovalute
8 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.