ERNIE-ViLG 2.0: Το νέο μοντέλο κειμένου σε εικόνα από την Baidu ξεπερνά τις επιδόσεις των Dalle-2 και Stable Diffusion
Εν συντομία
Τόσο το Dalle-2 όσο και Stable Diffusion ξεπέρασαν σημαντικά από το ERNIE-ViLG 2.0
ERNIE-ViLG 2.0 είναι ένα μοντέλο κειμένου σε εικόνα που προσφέρει καλύτερη απόδοση από το Dalle-2 και Stable Diffusion, δύο από τα πιο δημοφιλή μοντέλα κειμένου σε εικόνα που είναι διαθέσιμα αυτήν τη στιγμή. Το νέο μοντέλο σχεδιάστηκε και εκπαιδεύτηκε από μια ομάδα ερευνητών από την Baidu και τα αποτελέσματα κόβουν την ανάσα.
Τα αποτελέσματα έδειξαν ότι το ERNIE-ViLG 2.0 ξεπέρασε σημαντικά το Dalle-2 και Stable Diffusion. Αυτό είναι ένα σημαντικό επίτευγμα και καταδεικνύει τη δύναμη του πλαισίου ERNIE. ο Metaverse Post η ομάδα συνέκρινε το ERNIE-ViLG 2.0 με Stable Diffusion παρακάτω:
Αυτά τα αποτελέσματα παρέχουν ισχυρή υποστήριξη για την υπόθεση ότι το ERNIE-ViLG 2.0 είναι πιο αποτελεσματικό σύστημα κειμένου σε εικόνα από το Dalle-2 και Stable Diffusion.
Η αρχιτεκτονική Unet από Stable Diffusion λαμβάνεται ως βάση, αλλά με αλλαγές:
- Ένα μείγμα ειδικών για την αποθορυβοποίηση: Υπάρχουν 10 νευρωνικά δίκτυα αντί για ένα, με το καθένα να είναι υπεύθυνο μόνο για ορισμένα βήματα διάχυσης.
- Γνώσεις κειμένου: Αυτόματη επαναστάθμιση των λέξεων στο ερώτημα, ώστε οι λέξεις-κλειδιά να αποκτήσουν μεγαλύτερο βάρος.
- Οπτική γνώση: Κατά τη διάρκεια της προπόνησης, εντοπίστηκαν αντικείμενα σε αποτελέσματα ενδιάμεσης γενιάς και το βάρος της συνάρτησης απώλειας σε περιοχές με αντικείμενα αυξήθηκε.
Ως αποτέλεσμα, το μεγαλύτερο στον κόσμο μοντέλο κειμένου σε εικόνα βγήκε με 24 δισεκατομμύρια παραμέτρους (10 φορές μεγαλύτερες από την SD) για να εκπαιδεύσει το μοντέλο.
Οι προτροπές απλώς μεταφράζονται αυτόματα από τα κινέζικα στα αγγλικά στο Πρόσωπο αγκαλιάς δημόσια επίδειξη πριν σταλεί στο AI. Πολλά χαρακτηριστικά απορρέουν από αυτό.
- Η ERNIE δεν γνωρίζει διεθνή δημόσια πρόσωπα. Για παράδειγμα, ο ERNIE δεν γνωρίζει τον Arnold Schwarzenegger. Σίγουρα έχει τοπικά αγαπημένα στην Κίνα.
- Ως αποτέλεσμα, η μέθοδος χρήσης ονομάτων διασημοτήτων προτρέπει να ενισχύσει δραματικά την ποιότητα του πρόσωπα αποτυγχάνει.
- Μπορείτε να περιμένετε κάποια παραμόρφωση λόγω της μετάφρασης από τα κινέζικα, επομένως ενδέχεται να σας επιφυλάσσουν κάποιες εκπλήξεις εάν δεν μιλάτε κινέζικα.
- Ούτε καν γνωρίζει τίποτα για τον Γκρεγκ Ρουτκόφσκι.
Διαβάστε σχετικά άρθρα:
Αποποίηση ευθυνών
Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.
Σχετικά με το Συγγραφέας
Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.
Περισσότερα άρθραΟ Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου.