Αναφορά ειδήσεων Τεχνολογία
Ιούνιος 19, 2023

SnapFusion: Γρήγορο μοντέλο κειμένου σε εικόνα για φορητές συσκευές μέσα σε 1.9 δευτερόλεπτα

Εν συντομία

Το SnapFusion αλλάζει τη δημιουργία περιεχομένου εκτελώντας μοντέλα διάχυσης κειμένου σε εικόνα απευθείας σε κινητές συσκευές, μειώνοντας το κόστος και αντιμετωπίζοντας τα προβλήματα απορρήτου.

SnapFusion είναι ένα μοντέλο τεχνητής νοημοσύνης κειμένου σε εικόνα που επιτρέπει στους χρήστες να δημιουργούν εκπληκτικές εικόνες από περιγραφές φυσικής γλώσσας, όλα μέσα σε μόλις δύο δευτερόλεπτα στις φορητές συσκευές τους. Πέρασαν οι μέρες που βασιζόμασταν σε GPU υψηλής τεχνολογίας ή υπηρεσίες που βασίζονται σε cloud για την εκτέλεση αυτών των πολύπλοκων μοντέλων. Το SnapFusion εκδημοκρατίζει τη δημιουργία περιεχομένου δίνοντας τη δύναμη της διάδοσης κειμένου σε εικόνα στα χέρια των χρηστών.

SnapFusion: Γρήγορο και αποτελεσματικό μοντέλο κειμένου σε εικόνα για φορητές συσκευές μέσα σε 1.9 δευτερόλεπτα
πίστωσης: Midjourney / lili10292#2100

Η δημιουργία ρεαλιστικών εικόνων από περιγραφές κειμένου ήταν πάντα μια πρόκληση. Προηγούμενα μοντέλα απαιτούσε μεγάλες αρχιτεκτονικές δικτύου και πολλαπλές επαναλήψεις απόσβεσης θορύβου, καθιστώντας τις υπολογιστικά ακριβό και αργό. Επιπλέον, η εκτέλεση αυτών των μοντέλων συχνά περιελάμβανε την αποστολή δεδομένων χρήστη σε υπηρεσίες τρίτων, αύξηση θέματα ιδιωτικότητας.

Για να αντιμετωπίσουν αυτές τις προκλήσεις, οι δημιουργοί του SnapFusion ανέπτυξαν μια αποτελεσματική αρχιτεκτονική δικτύου και βελτίωσαν τη διαδικασία της σταδιακής απόσταξης. Με τον εντοπισμό πλεονασμάτων στο αρχικό μοντέλο, εισήγαγαν ένα αποτελεσματικό UNet και μείωσαν τον υπολογισμό του αποκωδικοποιητή εικόνας μέσω απόσταξη δεδομένων. Επιπλέον, ενίσχυσαν τη σταδιακή απόσταξη εξερευνώντας στρατηγικές εκπαίδευσης και εισάγοντας τεχνικές τακτοποίησης.

arxiv.org/pdf/2306.00980.pdf

Εκτεταμένα πειράματα στο Δεδομένα MS-COCO απέδειξε την ανωτερότητα του SnapFusion. Με μόλις οκτώ βήματα αφαίρεσης θορύβου, το SnapFusion πέτυχε καλύτερες βαθμολογίες FID και CLIP σε σύγκριση με το προηγούμενο μοντέλο τελευταίας τεχνολογίας, Stable Diffusion v1.5, που απαιτούσε 50 βήματα. Αυτή η αξιοσημείωτη βελτίωση στην αποτελεσματικότητα και την απόδοση ανοίγει νέες δυνατότητες για τη δημιουργία περιεχομένου.

Ο αντίκτυπος του SnapFusion υπερβαίνει τα τεχνικά του επιτεύγματα. Με το τρέξιμο μοντέλα διάχυσης κειμένου σε εικόνα απευθείας σε κινητές συσκευές, εξαλείφει την ανάγκη για ακριβές GPU και υπηρεσίες που βασίζονται σε cloud. Αυτό όχι μόνο μειώνει το κόστος, αλλά αντιμετωπίζει και προβλήματα απορρήτου που σχετίζονται με την αποστολή δεδομένων χρήστη σε τρίτους. Οι χρήστες μπορούν τώρα να απελευθερώσουν τη δημιουργικότητά τους και να δημιουργήσουν εικόνες υψηλής ποιότητας εν κινήσει.

Το μέγεθος της παραμέτρου του μοντέλου μπορεί να μειωθεί περαιτέρω ώστε να είναι συμβατό με διάφορες συσκευές άκρων. Επιπλέον, βελτιστοποίηση του μοντέλου για διαφορετικές κινητές συσκευές επιτύχει γρήγορη εξαγωγή συμπερασμάτων Οι ταχύτητες είναι ένα συνεχές θέμα έρευνας.

Είναι απαραίτητο να χρησιμοποιείτε το SnapFusion και παρόμοιες τεχνολογίες υπεύθυνα για την πρόληψη κακόβουλων εφαρμογών. Μπορούν να ληφθούν μέτρα, όπως συστήματα αυτόματης ανίχνευσης που εντοπίζουν και επισημαίνουν περιεχόμενο εικόνας που παραβιάζει τους κανονισμούς. Επιτυγχάνοντας μια ισορροπία μεταξύ καινοτομίας και ηθικών κριτηρίων, το SnapFusion μπορεί να αλλάξει τη δημιουργία περιεχομένου, διασφαλίζοντας παράλληλα μια ασφαλή και υπεύθυνη εμπειρία χρήστη.

Διαβάστε περισσότερα για το AI:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories

Ανακαλύψτε Crypto Whales: Who's Who στην Αγορά

by Βανκτόρια palchik
07 Μαΐου 2024
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταια νεα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Η LD Capital, η Antalpha Ventures και η Highblock Limited ενώνουν τις δυνάμεις τους για να ξεκινήσουν 128 εκατομμύρια $ Hong Kong ETF Liquidity Fund
Business αγορές Αναφορά ειδήσεων
Η LD Capital, η Antalpha Ventures και η Highblock Limited ενώνουν τις δυνάμεις τους για να ξεκινήσουν 128 εκατομμύρια $ Hong Kong ETF Liquidity Fund
8 Μαΐου 2024
Inside Wall Street Memes (WSM): Αποκαλύπτοντας τους τίτλους
Business αγορές Ιστορίες και κριτικές Τεχνολογία
Inside Wall Street Memes (WSM): Αποκαλύπτοντας τους τίτλους
7 Μαΐου 2024
Ανακαλύψτε Crypto Whales: Who's Who στην Αγορά
Business αγορές Ιστορίες και κριτικές Τεχνολογία
Ανακαλύψτε Crypto Whales: Who's Who στην Αγορά
7 Μαΐου 2024
Orbiter Finance Partners With Bitcoin Layer 2 Zulu Network and Deploys on Is Lwazi Testnet
Business Αναφορά ειδήσεων Τεχνολογία
Orbiter Finance Partners With Bitcoin Layer 2 Zulu Network and Deploys on Is Lwazi Testnet 
7 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.