Αναφορά ειδήσεων
Νοέμβριος 06, 2022

ERNIE-ViLG 2.0: Το νέο μοντέλο κειμένου σε εικόνα από την Baidu ξεπερνά τις επιδόσεις των Dalle-2 και Stable Diffusion

Εν συντομία

Τόσο το Dalle-2 όσο και Stable Diffusion ξεπέρασαν σημαντικά από το ERNIE-ViLG 2.0

ERNIE-ViLG 2.0 είναι ένα μοντέλο κειμένου σε εικόνα που προσφέρει καλύτερη απόδοση από το Dalle-2 και Stable Diffusion, δύο από τα πιο δημοφιλή μοντέλα κειμένου σε εικόνα που είναι διαθέσιμα αυτήν τη στιγμή. Το νέο μοντέλο σχεδιάστηκε και εκπαιδεύτηκε από μια ομάδα ερευνητών από την Baidu και τα αποτελέσματα κόβουν την ανάσα.

Το νέο μοντέλο κειμένου σε εικόνα ERNIE-ViLG 2.0 υπερτερεί των Dalle-2 και Stable Diffusion
Η εικόνα που δημιουργήθηκε από το ERNIE-ViLG 2.0

Τα αποτελέσματα έδειξαν ότι το ERNIE-ViLG 2.0 ξεπέρασε σημαντικά το Dalle-2 και Stable Diffusion. Αυτό είναι ένα σημαντικό επίτευγμα και καταδεικνύει τη δύναμη του πλαισίου ERNIE. ο Metaverse Post η ομάδα συνέκρινε το ERNIE-ViLG 2.0 με Stable Diffusion παρακάτω:

ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0
Stable Diffusion
ERNIE-ViLG 2.0

Αυτά τα αποτελέσματα παρέχουν ισχυρή υποστήριξη για την υπόθεση ότι το ERNIE-ViLG 2.0 είναι πιο αποτελεσματικό σύστημα κειμένου σε εικόνα από το Dalle-2 και Stable Diffusion.

Η αρχιτεκτονική Unet από Stable Diffusion λαμβάνεται ως βάση, αλλά με αλλαγές:

  • Ένα μείγμα ειδικών για την αποθορυβοποίηση: Υπάρχουν 10 νευρωνικά δίκτυα αντί για ένα, με το καθένα να είναι υπεύθυνο μόνο για ορισμένα βήματα διάχυσης.
  • Γνώσεις κειμένου: Αυτόματη επαναστάθμιση των λέξεων στο ερώτημα, ώστε οι λέξεις-κλειδιά να αποκτήσουν μεγαλύτερο βάρος.
  • Οπτική γνώση: Κατά τη διάρκεια της προπόνησης, εντοπίστηκαν αντικείμενα σε αποτελέσματα ενδιάμεσης γενιάς και το βάρος της συνάρτησης απώλειας σε περιοχές με αντικείμενα αυξήθηκε.

Ως αποτέλεσμα, το μεγαλύτερο στον κόσμο μοντέλο κειμένου σε εικόνα βγήκε με 24 δισεκατομμύρια παραμέτρους (10 φορές μεγαλύτερες από την SD) για να εκπαιδεύσει το μοντέλο.

Σε σύγκριση με προηγούμενα μοντέλα, το ERNIE-ViLG 2.0 τα υπερβαίνει κατά πολύ όσον αφορά την ποιότητα εικόνας και την αντιστοίχιση εικόνας σε κείμενο όταν δοκιμάζεται ταυτόχρονα στο δίγλωσσο ViLG-300 έγκαιρη που ορίζεται από ένα άτομο.

Οι προτροπές απλώς μεταφράζονται αυτόματα από τα κινέζικα στα αγγλικά στο Πρόσωπο αγκαλιάς δημόσια επίδειξη πριν σταλεί στο AI. Πολλά χαρακτηριστικά απορρέουν από αυτό.

  • Η ERNIE δεν γνωρίζει διεθνή δημόσια πρόσωπα. Για παράδειγμα, ο ERNIE δεν γνωρίζει τον Arnold Schwarzenegger. Σίγουρα έχει τοπικά αγαπημένα στην Κίνα.
  • Ως αποτέλεσμα, η μέθοδος χρήσης ονομάτων διασημοτήτων προτρέπει να ενισχύσει δραματικά την ποιότητα του πρόσωπα αποτυγχάνει.
  • Μπορείτε να περιμένετε κάποια παραμόρφωση λόγω της μετάφρασης από τα κινέζικα, επομένως ενδέχεται να σας επιφυλάσσουν κάποιες εκπλήξεις εάν δεν μιλάτε κινέζικα.
  • Ούτε καν γνωρίζει τίποτα για τον Γκρεγκ Ρουτκόφσκι.

Διαβάστε σχετικά άρθρα:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Το Injective ενώνει τις δυνάμεις του με το AltLayer για να επαναφέρει την ασφάλεια στο inEVM
Business Αναφορά ειδήσεων Τεχνολογία
Το Injective ενώνει τις δυνάμεις του με το AltLayer για να επαναφέρει την ασφάλεια στο inEVM
3 Μαΐου 2024
Η Masa συνεργάζεται με το Teller για να εισαγάγει το MASA Lending Pool, ενεργοποιεί τον βασικό δανεισμό USDC
αγορές Αναφορά ειδήσεων Τεχνολογία
Η Masa συνεργάζεται με το Teller για να εισαγάγει το MASA Lending Pool, ενεργοποιεί τον βασικό δανεισμό USDC
3 Μαΐου 2024
Η Velodrome κυκλοφορεί την έκδοση Superchain Beta τις επόμενες εβδομάδες και επεκτείνεται σε όλες τις OP Stack Layer 2 Blockchains
αγορές Αναφορά ειδήσεων Τεχνολογία
Η Velodrome κυκλοφορεί την έκδοση Superchain Beta τις επόμενες εβδομάδες και επεκτείνεται σε όλες τις OP Stack Layer 2 Blockchains
3 Μαΐου 2024
Η CARV ανακοινώνει συνεργασία με την Aethir για την αποκέντρωση του επιπέδου δεδομένων της και τη διανομή ανταμοιβών
Business Αναφορά ειδήσεων Τεχνολογία
Η CARV ανακοινώνει συνεργασία με την Aethir για την αποκέντρωση του επιπέδου δεδομένων της και τη διανομή ανταμοιβών
3 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.