Αναφορά ειδήσεων Τεχνολογία
Ιανουάριος 24, 2023

StyleGAN-T: Η ταχύτερη δημιουργία κειμένου σε εικόνα που παράγει αποτελέσματα σε λιγότερο από 0.1 δευτερόλεπτο

Εν συντομία

Το StyleGAN-T είναι ένα νέο GAN για δημιουργία tex2image.

Αυτό το GAN παράγει καλά αποτελέσματα και είναι ακόμη αρκετά γρήγορο (0.1 δευτ. για μια εικόνα 512×512).

Η νέα αρχιτεκτονική βασίζεται στο StyleGAN-XL, αλλά επαναξιολογεί τα σχέδια της γεννήτριας και του διαχωριστή.

Σίγουρα έχετε παρατηρήσει ότι τα GAN δεν συζητούνται πλέον όταν τίθεται το θέμα της δημιουργίας εικόνων. Μετά τη διάχυση μοντέλα όπως Stable Diffusion προέκυψε, τα GAN κάπως υποχώρησαν στο παρασκήνιο. Αυτό συμβαίνει επειδή είναι δύσκολο να προπονηθούν και συχνά σκοντάφτουν. Το μόνο πλεονέκτημα των GAN ​​ήταν ότι, σε αντίθεση με τα μοντέλα διάχυσης, παράγουν μια εικόνα σε μία μόνο εκτέλεση (ένα "πέρασμα προς τα εμπρός") αντί για πολλές διαδρομές.

StyleGAN-T: Η ταχύτερη δημιουργία κειμένου σε εικόνα σε λιγότερο από 0.1 δευτερόλεπτο

Τώρα όμως ένας νέος παίκτης από τα GAN μπήκε στο γήπεδο: StyleGAN-T. Αυτό το GAN για δημιουργία από κείμενο σε εικόνα παράγει καλά αποτελέσματα γρήγορα, καθώς χρειάζεται μόνο 0.1 δευτερόλεπτο για μια εικόνα 512×512. Η νέα αρχιτεκτονική βασίζεται στο StyleGAN-XL, αλλά επαναξιολογεί τη σχεδίαση της γεννήτριας και της συσκευής διάκρισης και χρησιμοποιεί το CLIP για ευθυγράμμιση προτροπής κειμένου και δημιουργούμενα γραφικά.

Σχετικό άρθρο: VToonify: Ένα μοντέλο τεχνητής νοημοσύνης σε πραγματικό χρόνο για τη δημιουργία καλλιτεχνικών βίντεο πορτρέτου

Γενικά, το StyleGAN-T δημιουργεί πλέον κείμενο σε εικόνα πιο γρήγορα και με μεγαλύτερη ακρίβεια από άλλα GAN. Ωστόσο, το GAN εξακολουθεί να είναι απαίσιο και η ποιότητα του μοντέλου SD πλήρους μεγέθους είναι προφανώς εκτός συζήτησης. Αλλά όλα αυτά θα εξαρτηθούν από την ικανότητα παραγωγής εικόνων εξαιρετικά υψηλής ποιότητας από κείμενο σε λιγότερο από ένα δευτερόλεπτο σε ένα χρόνο. Επιπλέον, θα πέσει κάπου μεταξύ του GAN και του μοντέλο διάχυσης.

Αρχιτεκτονική StyleGAN-T
Αρχιτεκτονική StyleGAN-T

Διαβάστε περισσότερα για το AI:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα

Οι ιδρυτές του πορτοφολιού Samourai κατηγορούνται για διευκόλυνση $2 δις σε προσφορές Darknet

Η σύλληψη των ιδρυτών του Samourai Wallet αντιπροσωπεύει μια αξιοσημείωτη οπισθοδρόμηση για τον κλάδο, υπογραμμίζοντας την επίμονη ...

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Η Pantera Capital επενδύει στην TON Blockchain, εκφράζει εμπιστοσύνη στο δυναμικό του Telegram να διευρύνει την προσβασιμότητα κρυπτογράφησης
Business Αναφορά ειδήσεων Τεχνολογία
Η Pantera Capital επενδύει στην TON Blockchain, εκφράζει εμπιστοσύνη στο δυναμικό του Telegram να διευρύνει την προσβασιμότητα κρυπτογράφησης
2 Μαΐου 2024
Η Mitosis συγκεντρώνει 7 εκατομμύρια δολάρια σε χρηματοδότηση από την Amber Group και την Foresight Ventures για να προωθήσει το αρθρωτό πρωτόκολλο ρευστότητας της
Business Αναφορά ειδήσεων Τεχνολογία
Η Mitosis συγκεντρώνει 7 εκατομμύρια δολάρια σε χρηματοδότηση από την Amber Group και την Foresight Ventures για να προωθήσει το αρθρωτό πρωτόκολλο ρευστότητας της
2 Μαΐου 2024
Η Galxe συνεργάζεται με το Jambo για να επεκτείνει την παγκόσμια προσβασιμότητα Web3
Business Αναφορά ειδήσεων Τεχνολογία
Η Galxe συνεργάζεται με το Jambo για να επεκτείνει την παγκόσμια προσβασιμότητα Web3
2 Μαΐου 2024
Ο Med-Gemini της Google είναι έτοιμος να δώσει το προβάδισμα GPT-4 Με τις Ανώτερες Επιδόσεις του στην Υγεία
AI Wiki Νέα λογισμικό Τεχνολογία
Ο Med-Gemini της Google είναι έτοιμος να δώσει το προβάδισμα GPT-4 Με τις Ανώτερες Επιδόσεις του στην Υγεία
2 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.