Αναφορά ειδήσεων
Οκτώβριος 06, 2022

Η Google ξεπερνά το Meta λανσάροντας μια νέα συσκευή δημιουργίας τεχνητής νοημοσύνης κειμένου σε βίντεο, Imagen Video 

Εν συντομία

Το Imagen Video της Google προσπαθεί να βοηθήσει τη δημιουργία βίντεο να μετατραπεί σε δολοφονικές εφαρμογές

Δεν άργησε η Google να απαντήσει στο Make-a-Video από το Meta. Χρησιμοποιώντας μια προτροπή κειμένου, Imagen Βίντεο μπορεί να δημιουργήσει ένα φανταστικό βίντεο. Τα αποτελέσματα είναι μια τεράστια πρόοδος πάνω από την στάθμη της τεχνολογίας παρά τα διάφορα μειονεκτήματα.

Σε σύγκριση με τη γεννήτρια τεχνητής νοημοσύνης Text-to-Video του Facebook Κάνε ένα βίντεο, τα αποτελέσματα είναι αισθητά καλύτερα. Ωστόσο, αυτή η στρατηγική απαιτούσε επίσης περισσότερη εποπτεία. Σε αντίθεση με το Imagen Video, όπου οι μικροεργάτες δούλεψαν σκληρά για να σχολιάσουν ταινίες με γραπτές περιγραφές, το Make-a-Scene χρησιμοποίησε βίντεο χωρίς ετικέτα για εκπαίδευση.

Το να μπούμε στις ιδιαιτερότητες της αρχιτεκτονικής είναι άσκοπο. θα πρέπει να το διαβάσετε στο άρθρο εδώ. Μπορούμε μόνο να επιβεβαιώσουμε ότι αρχικά δημιουργούνται 16 καρέ από την ενσωμάτωση κειμένου του κωδικοποιητή T5 σε ανάλυση 48×24 με 3 καρέ ανά δευτερόλεπτο και ότι στη συνέχεια αναβαθμίζεται από ορισμένα μοντέλα διάχυσης στην τελική ταινία των 128 καρέ σε 1280×768 και 24 καρέ ανά δευτερόλεπτο.

Τι είναι το Imagen Video;

Το Imagen Video είναι μια μέθοδος για τη δημιουργία βίντεο υπό όρους κειμένου με βάση μια σειρά μοντέλων διάχυσης βίντεο. Το Imagen Video παράγει ταινίες υψηλής ποιότητας από προτροπές κειμένου συνδυάζοντας ένα βασικό μοντέλο παραγωγής βίντεο με μια σειρά από συμπλεγμένα χωρικά και χρονικά μοντέλα βίντεο υπερ-ανάλυσης. Ανατρέξτε στην ομάδα επιλογών σχεδιασμού που έκανε ενώ κλιμακώνεται το σύστημα ως υψηλήςdefiμοντέλο κειμένου σε βίντεο, συμπεριλαμβανομένης της απόφασης για παραμετροποίηση μοντέλων διάχυσης v και την επιλογή πλήρως συνελικτικών χρονικών και χωρικών μοντέλων υπερ-ανάλυσης σε συγκεκριμένες αναλύσεις. Επιπλέον, επικυρώνει και εφαρμόζει αποτελέσματα από παλαιότερες εργασίες σχετικά με την παραγωγή εικόνων με βάση τη διάχυση στο πλαίσιο του δημιουργία βίντεο. Στη συνέχεια, τα μοντέλα βίντεο υποβάλλονται σε προοδευτική απόσταξη με καθοδήγηση χωρίς ταξινομητή για γρήγορη δειγματοληψία υψηλής ποιότητας.

Η ερευνητική ομάδα της Google ισχυρίζεται ότι το σύστημα δέχεται μια περιγραφή κειμένου και δημιουργεί μια ταινία 16 καρέ σε τρία καρέ ανά δευτερόλεπτο με ανάλυση 24 επί 48 pixel. Το σύστημα κλιμακώνει και «προβλέπει» τα επιπλέον καρέ, δημιουργώντας ένα τελικό βίντεο με 128 καρέ στα 24 καρέ ανά δευτερόλεπτο και ανάλυση 720p (1280×768). Υπάρχουν 60 εκατομμύρια ζεύγη εικόνας-κειμένου και 14 εκατομμύρια ζεύγη βίντεο-κειμένου χρησιμοποιήθηκαν για την εκπαίδευση του Imagen Video.

Imagen Δείγματα βίντεο

Ακόμα κι αν απλώς και μόνο επειδή η χρήση τεχνητής νοημοσύνης για τη δημιουργία βίντεο είναι πιο γρήγορη και λιγότερο δαπανηρή, τέτοιες τεχνολογίες αναμφίβολα θα χρησιμοποιηθούν παντού.

Ενδιαφέρεστε να διαβάσετε περισσότερα; Ακολουθούν ορισμένα πρόσθετα θέματα για έλεγχο:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

The DOGE Frenzy: Analysing the Dogecoin's (DOGE) Recent Surge in Value

Ο κλάδος των κρυπτονομισμάτων επεκτείνεται γρήγορα και τα meme coins προετοιμάζονται για μια σημαντική άνοδο. Dogecoin (DOGE), ...

Μάθετε περισσότερα

Η εξέλιξη του περιεχομένου που δημιουργείται από AI στο Metaverse

Η εμφάνιση του παραγωγικού περιεχομένου AI είναι μια από τις πιο συναρπαστικές εξελίξεις στο εικονικό περιβάλλον ...

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Οι κορυφαίες προσφορές αυτής της εβδομάδας, σημαντικές επενδύσεις σε τεχνητή νοημοσύνη, πληροφορική, Web3και Crypto (22-26.04)
Σύνοψη Business αγορές Τεχνολογία
Οι κορυφαίες προσφορές αυτής της εβδομάδας, σημαντικές επενδύσεις σε τεχνητή νοημοσύνη, πληροφορική, Web3και Crypto (22-26.04)
Απρίλιος 26, 2024
Vitalik Buterin Σχόλια σχετικά με τη συγκέντρωση του PoW, σημειώνει ότι ήταν προσωρινό στάδιο μέχρι το PoS
Αναφορά ειδήσεων Τεχνολογία
Vitalik Buterin Σχόλια σχετικά με τη συγκέντρωση του PoW, σημειώνει ότι ήταν προσωρινό στάδιο μέχρι το PoS
Απρίλιος 26, 2024
Η Offchain Labs αποκαλύπτει την ανακάλυψη δύο κρίσιμων τρωτών σημείων στα αποδεικτικά απάτης του Optimism's OP Stack
Αναφορά ειδήσεων λογισμικό Τεχνολογία
Η Offchain Labs αποκαλύπτει την ανακάλυψη δύο κρίσιμων τρωτών σημείων στα αποδεικτικά απάτης του Optimism's OP Stack
Απρίλιος 26, 2024
Η ανοιχτή αγορά της Dymension για γεφύρωση ρευστότητας από το RollApps, το eIBC κυκλοφορεί στο Mainnet
Αναφορά ειδήσεων Τεχνολογία
Η ανοιχτή αγορά της Dymension για γεφύρωση ρευστότητας από το RollApps, το eIBC κυκλοφορεί στο Mainnet 
Απρίλιος 26, 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.