Αναφορά ειδήσεων Τεχνολογία
Φεβρουάριος 08, 2023

Gen-1: Το AI δημιουργεί νέα βίντεο από υπάρχοντα συνδυάζοντας προτροπές και εικόνες

Εν συντομία

Το Gen-1 είναι ένα νευρωνικό δίκτυο που μπορεί να δημιουργήσει νέα βίντεο από υπάρχοντα με συνδυασμό προτροπές και εικόνες.

Θα μπορούσε επίσης να χρησιμοποιηθεί για τη δημιουργία εντελώς νέων βίντεο από την αρχή.

Η δυνατότητα δημιουργίας νέων βίντεο από υπάρχοντα έχει μια σειρά από πιθανές εφαρμογές.

RunWayML, μια startup τεχνητής νοημοσύνης, ανακοίνωσε ένα νέο προϊόν που ονομάζεται Gen-1, ένα νευρωνικό δίκτυο που μπορεί να δημιουργήσει νέα βίντεο από υπάρχοντα συνδυάζοντας προτροπές και εικόνες. Για χρόνια, τα νευρωνικά δίκτυα έχουν περιοριστεί στο έργο της μεταφοράς στυλ, που είναι η διαδικασία λήψης μιας εικόνας και εφαρμογής του στυλ μιας άλλης εικόνας σε αυτήν. Αυτός είναι ο τρόπος με τον οποίο λαμβάνουμε αυτά τα βίντεο μεταφοράς σε στυλ βαθιάς μάθησης, όπου, για παράδειγμα, ένα τοπίο αποδίδεται στο στυλ της Έναστρης Νύχτας του Βαν Γκογκ.

Gen-1: Η τεχνητή νοημοσύνη δημιουργεί νέα βίντεο από υπάρχοντα συνδυάζοντας μηνύματα προτροπής και εικόνες
@Midjourney / Αυτό το παράξενο φάντασμα

Τώρα, με το Gen-1, τα νευρωνικά δίκτυα μπορούν να κάνουν περισσότερα από απλή μεταφορά στυλ. Μπορεί να δημιουργήσει νέα βίντεο από την αρχή, χρησιμοποιώντας προτροπές και εικόνες ως είσοδο. Αυτό ανοίγει ένα εντελώς νέο φάσμα δυνατοτήτων για Βίντεο που δημιουργήθηκαν με AI. Αυτήν τη στιγμή, τα βίντεο που δημιουργούνται από το Gen-1 είναι σύντομα και απλά. Αλλά καθώς η τεχνολογία εξελίσσεται, μπορούμε να περιμένουμε να δούμε πιο πολύπλοκα και ρεαλιστικά βίντεο που δημιουργούνται από AI.

Προτεινόμενη ανάρτηση: Η αναπαραγωγική υγεία των ανδρών βελτιώνεται με την παρακολούθηση βίντεο ενηλίκων σε εικονική πραγματικότητα

Τι είναι το Gen-1;

Τα δυνατά εργαλεία δημιουργίας και επεξεργασίας εικόνων ξεκλειδώνονται με καθοδήγηση κειμένου μοντέλα γενετικής διάχυσης. Ενώ αυτά έχουν εφαρμοστεί στη δημιουργία βίντεο, οι παρούσες μέθοδοι για την επεξεργασία του περιεχομένου του ήδη υπάρχοντος υλικού διατηρώντας τη δομή του απαιτούν δαπανηρή επανεκπαίδευση για κάθε είσοδο ή εξαρτώνται από την επικίνδυνη μετάδοση αλλαγών εικόνας μεταξύ των καρέ.

Οι προγραμματιστές περιγράφουν ένα μοντέλο για διάχυση βίντεο καθοδηγούμενη από τη δομή και το περιεχόμενο, το οποίο αλλάζει τις ταινίες με βάση είτε γραπτές είτε οπτικές περιγραφές του επιθυμητού αποτελέσματος. Λόγω ανεπαρκούς αποσύνδεσης, προκύπτουν διενέξεις μεταξύ των τροποποιήσεων περιεχομένου που παρέχονται από τον χρήστη και των αναπαραστάσεων της δομής. Αποδεικνύουν ότι η δομή και η ακεραιότητα του περιεχομένου μπορούν να ελεγχθούν με εκπαίδευση σε εκτιμήσεις μονόφθαλμου βάθους με διάφορα επίπεδα λεπτομέρειας.

Συνθέστε νέα βίντεο με ρεαλιστικό και συνεπή τρόπο, εφαρμόζοντας τη σύνθεση και το στυλ μιας προτροπής εικόνας ή κειμένου στη δομή του βίντεο προέλευσης. Είναι σαν να κινηματογραφείς κάτι καινούργιο χωρίς να έχεις γυρίσει τίποτα στην πραγματικότητα.

Η σύνθεση ενός νέου βίντεο χρησιμοποιώντας αυτήν τη μέθοδο επιτρέπει στους κινηματογραφιστές να παράγουν γρήγορα περιεχόμενο με οικονομικά αποδοτικό τρόπο
Η σύνθεση ενός νέου βίντεο χρησιμοποιώντας αυτήν τη μέθοδο επιτρέπει στους κινηματογραφιστές να παράγουν γρήγορα περιεχόμενο με οικονομικά αποδοτικό τρόπο

Η μεταφορά του στυλ μιας εικόνας ή μιας προτροπής σε κάθε καρέ ενός βίντεο μπορεί να είναι ένας πολύ καλός τρόπος για να ενοποιήσετε το έργο σας, να του δώσετε ένα γενικό οπτικό θέμα και να δημιουργήσετε συνέπεια.

Μέσω της χρήσης λογισμικού και δημιουργικού σχεδιασμού, τα mockups μπορούν να μετατραπούν σε αισθητικά ευχάριστα και διαδραστικά render που ζωντανεύουν το όραμα του χρήστη.

Οι μακέτες επιτρέπουν στους σχεδιαστές να οπτικοποιήσουν τις ιδέες τους και να δημιουργήσουν απτά αποτελέσματα που μπορούν να παρουσιαστούν για έλεγχο
Οι μακέτες επιτρέπουν στους σχεδιαστές να οπτικοποιήσουν τις ιδέες τους και να δημιουργήσουν απτά αποτελέσματα που μπορούν να παρουσιαστούν για έλεγχο

Με τις λειτουργίες επεξεργασίας βίντεο, είναι εύκολο να απομονώσετε μέρη ενός βίντεο και να τα βελτιώσετε με μηνύματα κειμένου.

Εφαρμογή εικόνας εισόδου ή έγκαιρη σε μη υφή renders μπορούν να βελτιώσουν σημαντικά τον ρεαλισμό τους, ζωντανεύοντας τα τρισδιάστατα μοντέλα.

Η Runway Research είναι αφιερωμένη στην κατασκευή πολυτροπικών συστημάτων AI που επιτρέπουν νέες μορφές δημιουργικότητας. Το Gen-1 αντιπροσωπεύει ένα ακόμη από τα βασικά μας βήματα προς τα εμπρός σε αυτή την αποστολή. Εάν είστε δημιουργικός και θέλει να πειραματιστεί με το μέλλον της αφήγησης, ζητήστε πρόσβαση παρακάτω.

Το Gen-1 μπορεί επίσης να χρησιμοποιηθεί για τη δημιουργία εντελώς νέων βίντεο από την αρχή. Μπορεί να χρησιμοποιηθεί για διάφορους σκοπούς, συμπεριλαμβανομένης της δημιουργίας νέων εκδόσεων υπαρχουσών ταινιών ή της δημιουργίας νέων ταινιών συνολικά. Αυτά τα νέα είναι βέβαιο ότι θα ενθουσιάσουν τους κινηματογραφιστές και άλλους δημιουργικούς που αναζητούν πάντα νέους τρόπους για να ξεπεράσουν τα όρια της τέχνης τους. Με το Gen-1, έχουν τώρα στη διάθεσή τους ένα νέο ισχυρό εργαλείο.

Η δυνατότητα να δημιουργία νέων βίντεο από τα υπάρχοντα έχει μια σειρά από πιθανές εφαρμογές. Για παράδειγμα, θα μπορούσε να χρησιμοποιηθεί για τη δημιουργία νέων εκδόσεων του υπάρχοντος περιεχομένου βίντεο, επομένως θα μπορούσε να χρησιμοποιηθεί για τη δημιουργία εναλλακτικών εκδόσεων σκηνών ή λήψεων που μπορεί να είναι πολύ ακριβά ή υλικοτεχνικά δύσκολο να κινηματογραφηθούν.

Μπορείτε να κάνετε αίτηση για χρήση του μοντέλου ενώ βρίσκεται σε δοκιμή beta εδώ.

Διαβάστε περισσότερα για το AI:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

The DOGE Frenzy: Analysing the Dogecoin's (DOGE) Recent Surge in Value

Ο κλάδος των κρυπτονομισμάτων επεκτείνεται γρήγορα και τα meme coins προετοιμάζονται για μια σημαντική άνοδο. Dogecoin (DOGE), ...

Μάθετε περισσότερα

Η εξέλιξη του περιεχομένου που δημιουργείται από AI στο Metaverse

Η εμφάνιση του παραγωγικού περιεχομένου AI είναι μια από τις πιο συναρπαστικές εξελίξεις στο εικονικό περιβάλλον ...

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Οι κορυφαίες προσφορές αυτής της εβδομάδας, σημαντικές επενδύσεις σε τεχνητή νοημοσύνη, πληροφορική, Web3και Crypto (22-26.04)
Σύνοψη Business αγορές Τεχνολογία
Οι κορυφαίες προσφορές αυτής της εβδομάδας, σημαντικές επενδύσεις σε τεχνητή νοημοσύνη, πληροφορική, Web3και Crypto (22-26.04)
Απρίλιος 26, 2024
Vitalik Buterin Σχόλια σχετικά με τη συγκέντρωση του PoW, σημειώνει ότι ήταν προσωρινό στάδιο μέχρι το PoS
Αναφορά ειδήσεων Τεχνολογία
Vitalik Buterin Σχόλια σχετικά με τη συγκέντρωση του PoW, σημειώνει ότι ήταν προσωρινό στάδιο μέχρι το PoS
Απρίλιος 26, 2024
Η Offchain Labs αποκαλύπτει την ανακάλυψη δύο κρίσιμων τρωτών σημείων στα αποδεικτικά απάτης του Optimism's OP Stack
Αναφορά ειδήσεων λογισμικό Τεχνολογία
Η Offchain Labs αποκαλύπτει την ανακάλυψη δύο κρίσιμων τρωτών σημείων στα αποδεικτικά απάτης του Optimism's OP Stack
Απρίλιος 26, 2024
Η ανοιχτή αγορά της Dymension για γεφύρωση ρευστότητας από το RollApps, το eIBC κυκλοφορεί στο Mainnet
Αναφορά ειδήσεων Τεχνολογία
Η ανοιχτή αγορά της Dymension για γεφύρωση ρευστότητας από το RollApps, το eIBC κυκλοφορεί στο Mainnet 
Απρίλιος 26, 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.