Αναφορά ειδήσεων Τεχνολογία
Ιανουάριος 31, 2023

MusicLM: ένα νέο μοντέλο AI από κείμενο σε μουσική και εικόνα σε μουσική από την Google

Εν συντομία

Η Google παρουσιάζει το MusicLM, ένα μοντέλο για τη δημιουργία μουσικής υψηλής πιστότητας από περιγραφές κειμένου.

Το MusicLM μπορεί να ρυθμιστεί τόσο σε κείμενο όσο και σε μελωδία, καθώς μπορεί να μεταμορφώσει μελωδίες με σφυρίγματα και βουητά σύμφωνα με το στυλ που περιγράφεται σε μια λεζάντα κειμένου.

Το μοντέλο μπορεί παράγουν μουσική σε διάφορα είδη, όπως η κλασική, η τζαζ και η ροκ.

Η Google παρουσιάζει το MusicLM, ένα μοντέλο για τη δημιουργία μουσικής υψηλής πιστότητας από περιγραφές κειμένου όπως «μια ήρεμη μελωδία βιολιού που υποστηρίζεται από ένα παραμορφωμένο riff κιθάρας». Το MusicLM εκπέμπει τη διαδικασία παραγωγής μουσικής υπό όρους ως ιεραρχική εργασία μοντελοποίησης ακολουθίας σε ακολουθία και παράγει μουσική στα 24 kHz που παραμένει σταθερή για αρκετά λεπτά.

MusicLM: ένα νέο μοντέλο AI από κείμενο σε μουσική και εικόνα σε μουσική από την Google

Τα πειράματα της Google δείχνουν ότι το MusicLM ξεπερνά τα προηγούμενα συστήματα, τόσο σε ποιότητα ήχου όσο και σε συμμόρφωση με την περιγραφή του κειμένου. Επιπλέον, καταδεικνύει ότι το MusicLM μπορεί να εξαρτηθεί τόσο από κείμενο όσο και από μια μελωδία, καθώς μπορεί να μεταμορφώσει τις μελωδίες που σφυρίζουν και βουίζουν σύμφωνα με το στυλ που περιγράφεται σε μια λεζάντα κειμένου. Για να υποστηρίξουμε μελλοντική έρευνα, δημοσιεύουμε το MusicCaps, ένα σύνολο δεδομένων που αποτελείται από 5.5 χιλιάδες ζεύγη μουσικής-κειμένου με περιγραφές πλούσιων κειμένων που παρέχονται από ειδικούς σε ανθρώπους.

Σχετικό άρθρο: Κείμενο σε 3D: Η Google έχει αναπτύξει ένα νευρωνικό δίκτυο που δημιουργεί τρισδιάστατα μοντέλα από περιγραφές κειμένου

Το μοντέλο MusicLM έχει εκπαιδευτεί σε ένα μεγάλο σύνολο μουσικών παρτιτούρων, το οποίο επέτρεψε στο AI να μάθει τη δομή της μουσικής. Το μοντέλο μπορεί παράγουν μουσική σε διάφορα είδη, όπως η κλασική, η τζαζ και η ροκ. Επιπλέον, το μοντέλο AI μπορεί να δημιουργήσει νέες, πρωτότυπες συνθέσεις.

Το μοντέλο MusicLM είναι μια σημαντική εξέλιξη στον τομέα της μουσικής που δημιουργείται από AI. Το μοντέλο αντιπροσωπεύει μια σημαντική πρόοδο σε σχέση με τα προηγούμενα μοντέλα, τα οποία περιορίζονταν σε μικρότερα μουσικά κομμάτια ή μόνο ικανά να παράγουν απλές μελωδίες. Το νέο μοντέλο ανοίγει τη δυνατότητα χρήσης τεχνητής νοημοσύνης για τη δημιουργία μεγάλων, πολύπλοκων κομματιών μουσικής, τα οποία θα μπορούσαν να χρησιμοποιηθούν σε ταινίες, βιντεοπαιχνίδια ή άλλα μέσα.

Το νέο μοντέλο AI μπορεί να δημιουργήσει μεγάλη μουσική γενιές έως πέντε λεπτά.

Σχετικό άρθρο: Stable Diffusion μπορεί να δημιουργήσει νέα μουσική δημιουργώντας φασματογράμματα βασισμένα σε κείμενο

Το μοντέλο AI μπορεί να δημιουργήσει μουσική χρησιμοποιώντας λεζάντες από παιχνίδια και ταινίες.

Επιπλέον, το μοντέλο AI μπορεί να παράγει μουσική χρησιμοποιώντας εικόνες ως είσοδο.

Διαβάστε περισσότερα για την τεχνητή νοημοσύνη στη μουσική βιομηχανία:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταία νέα

The DOGE Frenzy: Analysing the Dogecoin's (DOGE) Recent Surge in Value

Ο κλάδος των κρυπτονομισμάτων επεκτείνεται γρήγορα και τα meme coins προετοιμάζονται για μια σημαντική άνοδο. Dogecoin (DOGE), ...

Μάθετε περισσότερα

Η εξέλιξη του περιεχομένου που δημιουργείται από AI στο Metaverse

Η εμφάνιση του παραγωγικού περιεχομένου AI είναι μια από τις πιο συναρπαστικές εξελίξεις στο εικονικό περιβάλλον ...

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Δείτε Περισσότερα
Διάβασε περισσότερα
Η ZetaChain διαθέτει το 5% της συνολικής προσφοράς διακριτικών για την ανάπτυξη του οικοσυστήματος, διατηρεί το 1% για τα έργα Bitcoin
αγορές Αναφορά ειδήσεων Τεχνολογία
Η ZetaChain διαθέτει το 5% της συνολικής προσφοράς διακριτικών για την ανάπτυξη του οικοσυστήματος, διατηρεί το 1% για τα έργα Bitcoin
Απρίλιος 25, 2024
Τα νομίσματα AI αυξάνονται μετά το μισό του Bitcoin: Μια ολοκληρωμένη ματιά στην εξέλιξη και τις μελλοντικές τάσεις της αγοράς
αγορές Ιστορίες και κριτικές Τεχνολογία
Τα νομίσματα AI αυξάνονται μετά το μισό του Bitcoin: Μια ολοκληρωμένη ματιά στην εξέλιξη και τις μελλοντικές τάσεις της αγοράς
Απρίλιος 25, 2024
The Dark Side of Deepfakes: Πώς οι κακόβουλοι ηθοποιοί χρησιμοποιούν συνθετικά μέσα για να χειραγωγήσουν και να εξαπατήσουν
Lifestyle λογισμικό Ιστορίες και κριτικές Τεχνολογία
The Dark Side of Deepfakes: Πώς οι κακόβουλοι ηθοποιοί χρησιμοποιούν συνθετικά μέσα για να χειραγωγήσουν και να εξαπατήσουν
Απρίλιος 25, 2024
Διαθέσιμο για ενσωμάτωση με Arbitrum, Optimism, Polygon, StarkWare και zkSync, Παρέχοντας Διαθεσιμότητα Δεδομένων
Αναφορά ειδήσεων Τεχνολογία
Διαθέσιμο για ενσωμάτωση με Arbitrum, Optimism, Polygon, StarkWare και zkSync, Παρέχοντας Διαθεσιμότητα Δεδομένων
Απρίλιος 25, 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.