Dall-E 3 vs. Midjourney: Μια μεγάλη σύγκριση των πιο προηγμένων γεννητριών τέχνης AI
Ελάτε μαζί μας σε αυτό το συναρπαστικό ταξίδι καθώς εξερευνούμε το Dall-E 3 και Midjourneyτις λεπτότητες, την πολυπλοκότητα και τις αναξιοποίητες δυνατότητες του. Αυτό το άρθρο επισημαίνει τις πιο ενδιαφέρουσες συγκρίσεις που βασίζονται σε έρευνα που έγινε από τον λάτρη της τεχνητής νοημοσύνης Atachkina. εάν ενδιαφέρεστε να μάθετε περισσότερα, κάντε κλικ στο σύνδεσμος.
Pro Συμβουλές |
---|
1. Αποκαλύψτε το Κορυφαία 50 προτροπή κειμένου σε εικόνα για Γεννήτριες Τέχνης AI Midjourney και DALL-E. |
2. Ανάψτε τη δημιουργικότητά σας με το Οι κορυφαίοι 20 παραγωγοί τέχνης AI Text-to-Image της 2023. |
Αυτό το άρθρο παρέχει μια προτροπή κειμένου σε εικόνα, μια εικόνα που δείχνει τα αποτελέσματα από το Dall-E 3 και Midjourney, και μια εξήγηση των διαφορών μεταξύ των δύο γεννήτριες τέχνης. Ας ξεκινήσουμε.
Και τα δύο νευρωνικά δίκτυα απέδωσαν θαυμάσια σε αυτή την περίπτωση, με το Midjourney ξεπερνώντας ελαφρώς τις άλλες.
Το Dall-E 3 έκανε πολύ χειρότερη δουλειά εδώ. πήρε τα φωτεινά χρώματα των στυλ, αλλά όχι τη σαφήνεια των λεπτομερειών. παραμορφωμένα σώματα εμφανίστηκαν στο βάθος και τα πρόσωπα δεν ήταν καθόλου επιτυχημένα.
Αποδείχτηκε ενδιαφέρον και στα δύο μέρη, αλλά το Dall-E 3 πάλεψε για άλλη μια φορά με τα πρόσωπα. Αντίθετα, έφτιαξε μια βελούδινη μπεζ τσάντα σύμφωνα με τις οδηγίες της προτροπής και Midjourney το αγνόησε. Σε αυτήν την περίπτωση, το Dall-E 3 ήταν πολύ υπάκουο στην εκτέλεση της προτροπής.
Και για άλλη μια φορά, ενώ και τα δύο πλέγματα κάνουν εξαιρετικά κολάζ, το Dall-E 3 είναι πιο πιστό στην προτροπή. πρόσθεσε μόνο τους ήρωες που προσδιορίσαμε, δεν μπορούσε να μετατραπεί σε τζόκερ και διασταύρωσε τον καπετάνιο με τον Μπάτμαν.
Midjourney μπόρεσε να συνδυάσει τα αντίστοιχα στυλ των δύο καλλιτεχνών από την προτροπή, ενώ το Dall-E 3 απλώς πρόσθεσε πολλές πολυάσχολες λεπτομέρειες και φωτεινά χρώματα στο φόντο.
Για άλλη μια φορά, οι γάτες είναι σε κορυφαία φόρμα και τα δύο νευρωνικά δίκτυα κατανοούν τέλεια τις κάμερες με φιλμ. Ωστόσο, το Dall-E 3 προσθέτει ακόμη και κόκκους στις φωτογραφίες.
Το Dall-E 3 δημιούργησε έναν νεαρό Leonardo DiCaprio με δροσερές υφές, πρόσθετους κόκκους και χρωματικούς συνδυασμούς και αντανακλούσε πολύ δροσερά την αίσθηση μιας ρωσικής ντάτσας. Midjourney ήταν ένας καλός ανακλαστήρας χρώματος για την ταινία και ο Ντι Κάπριο της έδωσε μια πιο ώριμη εμφάνιση.
Παρόλο που και τα δύο νευρωνικά δίκτυα είναι ικανοί στη δημιουργία κολάζ, αν κοιτάξετε προσεκτικά, Midjourney παραμορφώνει πρόσωπα και ορισμένα σχήματα αντικειμένων, ενώ το Dall-E 3 είναι πιο ακριβές στην εκτέλεση των ίδιων των χαρακτήρων — αποδείχθηκε ότι ήταν ακόμη και ο Chewbacca.
Όταν κάνετε μεγέθυνση στις φωτογραφίες, θα παρατηρήσετε ότι το Dall-E 3 έχει θολά μάτια. Midjourney, από την άλλη, είναι άψογο. Το Dall-E 3 όρισε επίσης μια μάρκα. Τα φίδια στα κεφάλια φαίνεται να είναι πιο ζωντανά και σε κίνηση. Midjourney τα έκανε πάντα ξαπλωμένα, παρά στο κεφάλι.
Και τα δύο είναι ωραία, αλλά Midjourney εξέτασε το στυλ του καλλιτέχνη καθώς και το εφέ μιας κινηματογραφικής κάμερας, ενώ το Dall-E 3 αγνόησε το πλήρους μήκους πλάνο και δεν το έλαβε υπόψη.
Πήραμε επίσης την απόφαση να δοκιμάσουμε μια φωτογραφία με νεράιδες, αλλά το Dall-E 3 αρνήθηκε πεισματικά να συνεργαστεί. Midjourney δεν αγνόησε τα φτερά γιατί είχε προστεθεί η αναφορά με φτερά. Όταν το Dall-E 3 τράβηξε μια φωτογραφία, πρόσφερε μερικές ενδιαφέρουσες δυνατότητες, αλλά με μια Αμερικανίδα.
Midjourney έκανε φανταστική δουλειά, αλλά θέλουμε να επιστήσουμε ιδιαίτερη προσοχή στο πώς το Dall-E 3 δημιούργησε τα εφέ ταινίας στην επάνω δεξιά εικόνα και πρόσθεσε το δικό του λευκό χειρόγραφο. βγήκε υπέροχο.
Το Dall-E 3 μπόρεσε να συνειδητοποιήσει πολύ υπάκουα όλους τους ήρωες της προτροπής σε μια εικόνα για άλλη μια φορά. Midjourney προσπάθησε πολύ σκληρά και κόντεψε να τα καταφέρει.
Με την πρώτη ματιά, φαίνεται ότι και τα δύο είναι καλά, αλλά η πιο προσεκτική εξέταση αποκαλύπτει ότι το Dall-E 3 δεν έχει φωτορεαλιστικό όγκο και ότι Midjourney χειριζόταν τις αρθρώσεις με πιρούνια με κρότο.
Και οι δύο γεννήτριες είναι ικανοί στα αντίστοιχα πεδία τους, με το Dall-E 3 να υπερέχει σε κείμενο και Midjourney διαπρέπει στον φωτορεαλισμό.
Η φυσική και η γεωμετρία των σεσουάρ μαλλιών είναι δύσκολη Midjourney. Μπορείτε να αφιερώσετε πολύ χρόνο παλεύοντας με τις προσπάθειες και τις αναφορές, και περιστασιακά τα αποτελέσματα μοιάζουν με πιστολάκι μαλλιών, αλλά το Dall-E 3 έδωσε ένα αποδεκτό αποτέλεσμα με την πρώτη προσπάθεια και έγραψε ακόμη και το κείμενο.
Το μόνο μάτι είναι καλό, αλλά αυτό είναι μια άλλη ιστορία. Σε Midjourney, γράψαμε μια αρνητική προτροπή – χωρίς κινούμενα σχέδια, εικονογράφηση, επίπεδη, δύο μάτια. Η Dall-E 3 υπάκουσε αμέσως και έκανε ένα μάτι, ένα χαμόγελο και ένα καπέλο, αλλά αρνήθηκε κατηγορηματικά να αφήσει κανέναν να τη φωτογραφίσει.
Midjourney έκανε τη γενιά να μην μοιάζει με τον Μπραντ, έτσι χρησιμοποιήσαμε την επιπλέον υπηρεσία Insight Ανταλλαγή προσώπου να βάλεις το πρόσωπο του Μπραντ στη γενιά. υπήρχε μια ανάρτηση σχετικά εδώ. Το Dall-E 3 ξέρει ποιος είναι ο Μπραντ Πιτ και μπορεί να σχεδιάσει αστέρια χωρίς πρόσθετο λογισμικό.
Και τα δύο πλέγματα είναι καλά, αλλά το Dall-E 3 μπορεί να δημιουργήσει κέρατα μονόκερου ενώ Midjourney τυπικά δεν μπορεί.
Το Dall-E 3 έκανε καλή δουλειά για να βάλει τους χαρακτήρες σε δράση. μπορούμε να δούμε ένα ορκ και ένα ξωτικό με αυτιά ξωτικού. Υπάρχει και ένα άτομο που φοράει αθλητική φόρμα Nike, αλλά τα μάτια του είναι μουντζούρα. Τα ξωτικά μυτερά αυτιά αγνοούνται ως επί το πλείστον Midjourney, και η Nike επίσης αγνοείται.
Όταν το υστερόγραφο "εικονογράφηση" έμεινε αρχικά έξω από την προτροπή, το Dall-E 3 δημιούργησε ένα. Τότε αποφασίσαμε να το συγκρίνουμε Midjourneyεικονογράφηση του. Ενώ Midjourney Έμοιαζε περισσότερο με εικονογραφήσεις της σοβιετικής εποχής και δεν περιελάμβανε τα φτερά της νεράιδας, το Dall-E 3 έκανε φανταστική δουλειά σχεδιάζοντας το σφυροδρέπανο. Το παράδειγμα στα δεξιά δείχνει πώς μπορεί να εμφανίζεται το Dall-E 3 στο κείμενο.
Ωστόσο, Midjourney πήγε στον φωτορεαλισμό. δεν υπάρχει κύριος χαρακτήρας στις εικόνες, μόνο το περιβάλλον, αλλά ακόμα δροσερό. Το Dall-E 3 δεν ήθελε να είναι ξανά στη φωτογραφία.
Dall-E 3 vs. Midjourney: Υπέρ και κατά
Καθώς οι χρήστες εξερευνούν αυτήν την τεχνολογία, αρκετά αξιοσημείωτα πλεονεκτήματα και περιορισμοί έχουν έρθει στο φως, δίνοντας περισσότερες πληροφορίες για τη λειτουργικότητά της.
Πλεονεκτήματα:
- Άμεση υπακοή: Ένα από τα ξεχωριστά χαρακτηριστικά του Dall-E 3 είναι η αξιοσημείωτη ικανότητά του να ακολουθεί με ακρίβεια τις προτροπές. Οι χρήστες ανέφεραν ότι το μοντέλο AI ανταποκρίνεται αποτελεσματικά σε ένα ευρύ φάσμα εισροών, καθιστώντας το ένα ευέλικτο εργαλείο για διάφορες εργασίες.
- Πολύπλευρη δημιουργικότητα: Το Dall-E 3 παρουσιάζει τη δυνατότητα απεικόνισης πολλών χαρακτήρων σε μια ενιαία εικόνα, διευρύνοντας τις δυνατότητές του για αφήγηση και δημιουργικά έργα. Αυτή η πολύπλευρη προσέγγιση ενισχύει τη χρησιμότητά της σε διαφορετικούς τομείς.
- Ενσωμάτωση κειμένου: Οι χρήστες έχουν σημειώσει την ικανότητα του Dall-E 3 να ενσωματώνει απρόσκοπτα κείμενο σε εικόνες. Αυτή η δυνατότητα διευκολύνει τη δημιουργία οπτικά ελκυστικού περιεχομένου με ενσωματωμένα κειμενικά στοιχεία.
Μειονεκτήματα:
- Σαφήνεια εικόνας: Ένας αξιοσημείωτος περιορισμός είναι η τάση του AI να παράγει εικόνες με θολά πρόσωπα και μάτια. Αν και υπερέχει στη δημιουργικότητα, μερικές φορές στερείται τη σαφήνεια και την ακρίβεια που φαίνεται στο περιεχόμενο που δημιουργείται από τον άνθρωπο.
- Συνοχή στυλ: Το Dall-E 3 δεν αναπαράγει με συνέπεια τα στυλ συγκεκριμένων καλλιτεχνών, το οποίο μπορεί να είναι ένα μειονέκτημα για όσους αναζητούν ακριβή καλλιτεχνική μίμηση.
- Απαίτηση VPN: Η πρόσβαση στο Dall-E 3 απαιτεί επί του παρόντος τη χρήση ενός VPN, το οποίο μπορεί να δημιουργήσει προκλήσεις προσβασιμότητας για ορισμένους χρήστες.
- Διαχείριση εικόνας: Οι χρήστες αντιμετώπισαν περιορισμούς κατά τη διαχείριση εικόνων που δημιουργούνται στον ιστότοπο του Microsoft Bing. Σημειωτέον, δεν υπάρχει λειτουργία προσανατολισμού μορφής και το ιστορικό εικόνων περιορίζεται σε πρόσφατες μεταφορτώσεις, γεγονός που απαιτεί άμεση αντιγραφή για μελλοντική χρήση.
- Ταχύτητα γενιάς: Σε ορισμένες περιπτώσεις, η διαδικασία παραγωγής στο Dall-E 3 έχει αναφερθεί ότι είναι πιο αργή σε σύγκριση με άλλα μοντέλα AI.
Παρά τους περιορισμούς αυτούς, το Dall-E 3 υπόσχεται ουσιαστικά. Οι χρήστες και οι ειδικοί αναγνωρίζουν τις δυνατότητές του να φέρει επανάσταση στη δημιουργία περιεχομένου και την αφήγηση ιστοριών. Οπως και OpenAI συνεχίζει να βελτιώνει και να επεκτείνει τις προσφορές του, αναμένεται ότι τα δυνατά σημεία του Dall-E 3 θα λάμψουν ακόμη πιο έντονα, καθιστώντας το ένα πολύτιμο εργαλείο σε διάφορους τομείς.
FAQs
Τόσο το Dall-E 3 όσο και Midjourney έχουν τα δυνατά και τα αδύνατα σημεία τους. Το Dall-E 3 είναι ιδιαίτερα υπάκουο στις προτροπές και μπορεί να ενσωματώσει απρόσκοπτα κείμενο σε εικόνες. Ωστόσο, μερικές φορές παράγει εικόνες με θολά πρόσωπα και μάτια και μπορεί να μην αναπαράγει με συνέπεια τα στυλ συγκεκριμένων καλλιτεχνών. Αφ 'ετέρου, Midjourney υπερέχει στον φωτορεαλισμό, αλλά μπορεί να μην αποτυπώνει πάντα την ουσία ορισμένων προτροπών με την ίδια ακρίβεια όπως το Dall-E 3.
Το άρθρο παρέχει μηνύματα κειμένου σε εικόνα, παρουσιάζοντας τα αποτελέσματα τόσο από το Dall-E 3 όσο και Midjourney, και εξηγεί τις διαφορές μεταξύ των δύο γεννητριών τέχνης.
Και τα δύο μοντέλα AI έχουν τα δυνατά και τα αδύνατα σημεία τους. Για παράδειγμα, σε μια προτροπή για έναν διαστημόπλοιο στον Δία, Midjourney ξεπέρασε ελαφρώς το Dall-E 3. Ωστόσο, σε μια άλλη προτροπή για το Wonder Woman, το Dall-E 3 ήταν πιο ακριβές στην αποτύπωση της ουσίας της προτροπής.
- Άμεση υπακοή: Το Dall-E 3 ακολουθεί με ακρίβεια τις οδηγίες.
- Πολύπλευρη Δημιουργικότητα: Μπορεί να απεικονίσει πολλούς χαρακτήρες σε μία εικόνα.
- Ενσωμάτωση κειμένου: Το Dall-E 3 μπορεί να ενσωματώσει απρόσκοπτα κείμενο σε εικόνες.
- Διαύγεια εικόνας: Μερικές φορές παράγει εικόνες με θολά πρόσωπα και μάτια.
- Συνέπεια στυλ: Το Dall-E 3 δεν αναπαράγει με συνέπεια τα στυλ συγκεκριμένων καλλιτεχνών.
- Διαχείριση εικόνας: Υπάρχουν περιορισμοί κατά τη διαχείριση εικόνων που δημιουργούνται στον ιστότοπο του Microsoft Bing.
- Ταχύτητα Γενιάς: Η διαδικασία παραγωγής του Dall-E 3 μπορεί να είναι πιο αργή σε σύγκριση με άλλα μοντέλα AI.
Αποποίηση ευθυνών
Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.
Σχετικά με το Συγγραφέας
Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.
Περισσότερα άρθραΟ Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.