Αναφορά ειδήσεων Τεχνολογία
Ιανουάριος 31, 2023

MusicLM: ένα νέο μοντέλο AI από κείμενο σε μουσική και εικόνα σε μουσική από την Google

Εν συντομία

Η Google παρουσιάζει το MusicLM, ένα μοντέλο για τη δημιουργία μουσικής υψηλής πιστότητας από περιγραφές κειμένου.

Το MusicLM μπορεί να ρυθμιστεί τόσο σε κείμενο όσο και σε μελωδία, καθώς μπορεί να μεταμορφώσει μελωδίες με σφυρίγματα και βουητά σύμφωνα με το στυλ που περιγράφεται σε μια λεζάντα κειμένου.

Το μοντέλο μπορεί παράγουν μουσική σε διάφορα είδη, όπως η κλασική, η τζαζ και η ροκ.

Η Google παρουσιάζει το MusicLM, ένα μοντέλο για τη δημιουργία μουσικής υψηλής πιστότητας από περιγραφές κειμένου όπως «μια ήρεμη μελωδία βιολιού που υποστηρίζεται από ένα παραμορφωμένο riff κιθάρας». Το MusicLM εκπέμπει τη διαδικασία παραγωγής μουσικής υπό όρους ως ιεραρχική εργασία μοντελοποίησης ακολουθίας σε ακολουθία και παράγει μουσική στα 24 kHz που παραμένει σταθερή για αρκετά λεπτά.

MusicLM: ένα νέο μοντέλο AI από κείμενο σε μουσική και εικόνα σε μουσική από την Google

Τα πειράματα της Google δείχνουν ότι το MusicLM ξεπερνά τα προηγούμενα συστήματα, τόσο σε ποιότητα ήχου όσο και σε συμμόρφωση με την περιγραφή του κειμένου. Επιπλέον, καταδεικνύει ότι το MusicLM μπορεί να εξαρτηθεί τόσο από κείμενο όσο και από μια μελωδία, καθώς μπορεί να μεταμορφώσει τις μελωδίες που σφυρίζουν και βουίζουν σύμφωνα με το στυλ που περιγράφεται σε μια λεζάντα κειμένου. Για να υποστηρίξουμε μελλοντική έρευνα, δημοσιεύουμε το MusicCaps, ένα σύνολο δεδομένων που αποτελείται από 5.5 χιλιάδες ζεύγη μουσικής-κειμένου με περιγραφές πλούσιων κειμένων που παρέχονται από ειδικούς σε ανθρώπους.

Σχετικό άρθρο: Κείμενο σε 3D: Η Google έχει αναπτύξει ένα νευρωνικό δίκτυο που δημιουργεί τρισδιάστατα μοντέλα από περιγραφές κειμένου

Το μοντέλο MusicLM έχει εκπαιδευτεί σε ένα μεγάλο σύνολο μουσικών παρτιτούρων, το οποίο επέτρεψε στο AI να μάθει τη δομή της μουσικής. Το μοντέλο μπορεί παράγουν μουσική σε διάφορα είδη, όπως η κλασική, η τζαζ και η ροκ. Επιπλέον, το μοντέλο AI μπορεί να δημιουργήσει νέες, πρωτότυπες συνθέσεις.

Το μοντέλο MusicLM είναι μια σημαντική εξέλιξη στον τομέα της μουσικής που δημιουργείται από AI. Το μοντέλο αντιπροσωπεύει μια σημαντική πρόοδο σε σχέση με τα προηγούμενα μοντέλα, τα οποία περιορίζονταν σε μικρότερα μουσικά κομμάτια ή μόνο ικανά να παράγουν απλές μελωδίες. Το νέο μοντέλο ανοίγει τη δυνατότητα χρήσης τεχνητής νοημοσύνης για τη δημιουργία μεγάλων, πολύπλοκων κομματιών μουσικής, τα οποία θα μπορούσαν να χρησιμοποιηθούν σε ταινίες, βιντεοπαιχνίδια ή άλλα μέσα.

Το νέο μοντέλο AI μπορεί να δημιουργήσει μεγάλη μουσική γενιές έως πέντε λεπτά.

Σχετικό άρθρο: Stable Diffusion μπορεί να δημιουργήσει νέα μουσική δημιουργώντας φασματογράμματα βασισμένα σε κείμενο

Το μοντέλο AI μπορεί να δημιουργήσει μουσική χρησιμοποιώντας λεζάντες από παιχνίδια και ταινίες.

Επιπλέον, το μοντέλο AI μπορεί να παράγει μουσική χρησιμοποιώντας εικόνες ως είσοδο.

Διαβάστε περισσότερα για την τεχνητή νοημοσύνη στη μουσική βιομηχανία:

Αποποίηση ευθυνών

Σύμφωνα με το Οδηγίες του έργου Trust, σημειώστε ότι οι πληροφορίες που παρέχονται σε αυτήν τη σελίδα δεν προορίζονται και δεν πρέπει να ερμηνεύονται ως νομικές, φορολογικές, επενδυτικές, χρηματοοικονομικές ή οποιαδήποτε άλλη μορφή συμβουλής. Είναι σημαντικό να επενδύσετε μόνο ό,τι έχετε την πολυτέλεια να χάσετε και να αναζητήσετε ανεξάρτητες οικονομικές συμβουλές εάν έχετε οποιεσδήποτε αμφιβολίες. Για περισσότερες πληροφορίες, προτείνουμε να ανατρέξετε στους όρους και τις προϋποθέσεις, καθώς και στις σελίδες βοήθειας και υποστήριξης που παρέχονται από τον εκδότη ή τον διαφημιστή. MetaversePost δεσμεύεται για ακριβείς, αμερόληπτες αναφορές, αλλά οι συνθήκες της αγοράς υπόκεινται σε αλλαγές χωρίς προειδοποίηση.

Σχετικά με το Συγγραφέας

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Περισσότερα άρθρα
Νταμίρ Γιαλάλοφ
Νταμίρ Γιαλάλοφ

Ο Damir είναι ο αρχηγός της ομάδας, ο διευθυντής προϊόντων και ο συντάκτης στο Metaverse Post, καλύπτοντας θέματα όπως AI/ML, AGI, LLMs, Metaverse και Web3-σχετικά πεδία. Τα άρθρα του προσελκύουν ένα τεράστιο κοινό άνω του ενός εκατομμυρίου χρηστών κάθε μήνα. Φαίνεται να είναι ειδικός με 10ετή εμπειρία στο SEO και το ψηφιακό μάρκετινγκ. Ο Damir έχει αναφερθεί στο Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto και άλλες εκδόσεις. Ταξιδεύει μεταξύ των ΗΑΕ, της Τουρκίας, της Ρωσίας και της ΚΑΚ ως ψηφιακός νομάδας. Ο Damir απέκτησε πτυχίο στη φυσική, το οποίο πιστεύει ότι του έχει δώσει τις δεξιότητες κριτικής σκέψης που απαιτούνται για να είναι επιτυχής στο συνεχώς μεταβαλλόμενο τοπίο του Διαδικτύου. 

Hot Stories
Εγγραφείτε στο ενημερωτικό μας δελτίο.
Τελευταια νεα

Η θεσμική όρεξη αυξάνεται προς τα ETF του Bitcoin εν μέσω αστάθειας

Οι αποκαλύψεις μέσω των καταθέσεων 13F αποκαλύπτουν αξιόλογους θεσμικούς επενδυτές που ασχολούνται με τα Bitcoin ETF, υπογραμμίζοντας την αυξανόμενη αποδοχή του ...

Μάθετε περισσότερα

Έφτασε η ημέρα της ποινής: Η μοίρα της CZ βρίσκεται σε ισορροπία καθώς το δικαστήριο των ΗΠΑ εξετάζει την ένσταση του DOJ

Ο Changpeng Zhao είναι έτοιμος να αντιμετωπίσει την καταδίκη σε αμερικανικό δικαστήριο στο Σιάτλ σήμερα.

Μάθετε περισσότερα
Γίνετε μέλος της Καινοτόμου Τεχνολογικής Κοινότητας μας
Διαβάστε Περισσότερα
Διάβασε περισσότερα
Το Optimism-Powered Ethereum Layer 2 Network Mint θα κυκλοφορήσει το Mainnet του στις 15 Μαΐου
Αναφορά ειδήσεων Τεχνολογία
Το Optimism-Powered Ethereum Layer 2 Network Mint θα κυκλοφορήσει το Mainnet του στις 15 Μαΐου
10 Μαΐου 2024
Οι κορυφαίες προσφορές αυτής της εβδομάδας, σημαντικές επενδύσεις σε τεχνητή νοημοσύνη, πληροφορική, Web3και Crypto (06-10.04)
Σύνοψη Business αγορές λογισμικό Τεχνολογία
Οι κορυφαίες προσφορές αυτής της εβδομάδας, σημαντικές επενδύσεις σε τεχνητή νοημοσύνη, πληροφορική, Web3και Crypto (06-10.04)
10 Μαΐου 2024
Το StaFi ενσωματώνει την υποστήριξη για το LRT της EigenLayer στη στοίβα Liquid-Staking-as-a-Service
αγορές Αναφορά ειδήσεων Τεχνολογία
Το StaFi ενσωματώνει την υποστήριξη για το LRT της EigenLayer στη στοίβα Liquid-Staking-as-a-Service
10 Μαΐου 2024
Οι ενεργές διευθύνσεις Bitcoin πέφτουν σε χαμηλό τετραετίας, προβλέπεται να φτάσουν μόνο τα 1.3 εκατομμύρια στον τρέχοντα κύκλο, αποκαλύπτει ο Bloomberg Crypto Analyst
αγορές Αναφορά ειδήσεων Τεχνολογία
Οι ενεργές διευθύνσεις Bitcoin πέφτουν σε χαμηλό τετραετίας, προβλέπεται να φτάσουν μόνο τα 1.3 εκατομμύρια στον τρέχοντα κύκλο, αποκαλύπτει ο Bloomberg Crypto Analyst
10 Μαΐου 2024
CRYPTOMERIA LABS PTE. Ε.Π.Ε.