Αναφορά ειδήσεων
Νοέμβριος 06, 2022

ERNIE-ViLG 2.0: Το νέο μοντέλο κειμένου σε εικόνα από την Baidu ξεπερνά τις επιδόσεις των Dalle-2 και Stable Diffusion

Εν συντομία

Τόσο το Dalle-2 όσο και Stable Diffusion ξεπέρασαν σημαντικά από το ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 είναι ένα μοντέλο κειμένου σε εικόνα που προσφέρει καλύτερη απόδοση από το Dalle-2 και Stable Diffusion, δύο από τα πιο δημοφιλή μοντέλα κειμένου σε εικόνα που είναι διαθέσιμα αυτήν τη στιγμή. Το νέο μοντέλο σχεδιάστηκε και εκπαιδεύτηκε από μια ομάδα ερευνητών από την Baidu και τα αποτελέσματα κόβουν την ανάσα.

Το νέο μοντέλο κειμένου σε εικόνα ERNIE-ViLG 2.0 υπερτερεί των Dalle-2 και Stable Diffusion
Η εικόνα που δημιουργήθηκε από το ERNIE-ViLG 2.0

Τα αποτελέσματα έδειξαν ότι το ERNIE-ViLG 2.0 ξεπέρασε σημαντικά το Dalle-2 και Stable Diffusion. Αυτό είναι ένα σημαντικό επίτευγμα και καταδεικνύει τη δύναμη του πλαισίου ERNIE. ο Metaverse Post η ομάδα συνέκρινε το ERNIE-ViLG 2.0 με Stable Diffusion παρακάτω:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Αυτά τα αποτελέσματα παρέχουν ισχυρή υποστήριξη για την υπόθεση ότι το ERNIE-ViLG 2.0 είναι πιο αποτελεσματικό σύστημα κειμένου σε εικόνα από το Dalle-2 και Stable Diffusion.

Η αρχιτεκτονική Unet από Stable Diffusion λαμβάνεται ως βάση, αλλά με αλλαγές:

  • Ένα μείγμα ειδικών για την αποθορυβοποίηση: Υπάρχουν 10 νευρωνικά δίκτυα αντί για ένα, με το καθένα να είναι υπεύθυνο μόνο για ορισμένα βήματα διάχυσης.
  • Γνώσεις κειμένου: Αυτόματη επαναστάθμιση των λέξεων στο ερώτημα, ώστε οι λέξεις-κλειδιά να αποκτήσουν μεγαλύτερο βάρος.
  • Οπτική γνώση: Κατά τη διάρκεια της προπόνησης, εντοπίστηκαν αντικείμενα σε αποτελέσματα ενδιάμεσης γενιάς και το βάρος της συνάρτησης απώλειας σε περιοχές με αντικείμενα αυξήθηκε.

Ως αποτέλεσμα, το μεγαλύτερο στον κόσμο μοντέλο κειμένου σε εικόνα βγήκε με 24 δισεκατομμύρια παραμέτρους (10 φορές μεγαλύτερες από την SD) για να εκπαιδεύσει το μοντέλο.

Σε σύγκριση με προηγούμενα μοντέλα, το ERNIE-ViLG 2.0 τα υπερβαίνει κατά πολύ όσον αφορά την ποιότητα εικόνας και την αντιστοίχιση εικόνας σε κείμενο όταν δοκιμάζεται ταυτόχρονα στο δίγλωσσο ViLG-300 έγκαιρη που ορίζεται από ένα άτομο.

Οι προτροπές απλώς μεταφράζονται αυτόματα από τα κινέζικα στα αγγλικά στο Πρόσωπο αγκαλιάς δημόσια επίδειξη πριν σταλεί στο AI. Πολλά χαρακτηριστικά απορρέουν από αυτό.

  • Η ERNIE δεν γνωρίζει διεθνή δημόσια πρόσωπα. Για παράδειγμα, ο ERNIE δεν γνωρίζει τον Arnold Schwarzenegger. Σίγουρα έχει τοπικά αγαπημένα στην Κίνα.
  • Ως αποτέλεσμα, η μέθοδος χρήσης ονομάτων διασημοτήτων προτρέπει να ενισχύσει δραματικά την ποιότητα του πρόσωπα αποτυγχάνει.
  • Μπορείτε να περιμένετε κάποια παραμόρφωση λόγω της μετάφρασης από τα κινέζικα, επομένως ενδέχεται να σας επιφυλάσσουν κάποιες εκπλήξεις εάν δεν μιλάτε κινέζικα.
  • Ούτε καν γνωρίζει τίποτα για τον Γκρεγκ Ρουτκόφσκι.

Διαβάστε σχετικά άρθρα:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories

Εμπορική λύση BRICS Nations Eye Stablecoin

by Βανκτόρια palchik
01 Μαΐου 2024
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα

Οι ιδρυτές του πορτοφολιού Samourai κατηγορούνται για διευκόλυνση $2 δις σε προσφορές Darknet

Η σύλληψη των ιδρυτών του Samourai Wallet αντιπροσωπεύει μια αξιοσημείωτη οπισθοδρόμηση για τον κλάδο, υπογραμμίζοντας την επίμονη ...

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Η Ankr συνεργάζεται με την πλατφόρμα AI Blockchain Talus Network για να ξεκλειδώσει τη ρευστότητα Bitcoin για τεχνητή νοημοσύνη
Business Αναφορά ειδήσεων Τεχνολογία
Η Ankr συνεργάζεται με την πλατφόρμα AI Blockchain Talus Network για να ξεκλειδώσει τη ρευστότητα Bitcoin για τεχνητή νοημοσύνη
1 Μαΐου 2024
Το Binance Labs υποστηρίζει τα Movement Labs για να διευκολύνει την ενσωμάτωση μετακίνησης του Facebook σε όλες τις αλυσίδες μπλοκ
Business Αναφορά ειδήσεων Τεχνολογία
Το Binance Labs υποστηρίζει τα Movement Labs για να διευκολύνει την ενσωμάτωση μετακίνησης του Facebook σε όλες τις αλυσίδες μπλοκ
1 Μαΐου 2024
Εμπορική λύση BRICS Nations Eye Stablecoin
Business αγορές Ιστορίες και κριτικές Τεχνολογία
Εμπορική λύση BRICS Nations Eye Stablecoin
1 Μαΐου 2024
Το Bitcoin L2 Network BOB ενσωματώνεται με το LayerZero για βελτιωμένη λειτουργικότητα
Business Αναφορά ειδήσεων Τεχνολογία
Το Bitcoin L2 Network BOB ενσωματώνεται με το LayerZero για βελτιωμένη λειτουργικότητα
1 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.