MusicLM: model AI teks-ke-muzik dan imej-ke-muzik baharu daripada Google
Secara ringkas
Google memperkenalkan MusicLM, model untuk menjana muzik kesetiaan tinggi daripada penerangan teks.
MusicLM boleh dikondisikan pada kedua-dua teks dan melodi kerana ia boleh mengubah melodi bersiul dan bersenandung mengikut gaya yang diterangkan dalam kapsyen teks.
Model boleh menjana muzik dalam pelbagai genre, termasuk klasik, jazz dan rock.
Google memperkenalkan MusicLM, model untuk menjana muzik ketelitian tinggi daripada perihalan teks seperti "melodi biola menenangkan yang disokong oleh riff gitar yang herot." MusicLM menghantar proses penjanaan muzik bersyarat sebagai tugas pemodelan jujukan-ke-jujukan hierarki, dan ia menjana muzik pada 24 kHz yang kekal konsisten selama beberapa minit.
Percubaan Google menunjukkan bahawa MusicLM mengatasi sistem sebelumnya, baik dalam kualiti audio dan pematuhan pada perihalan teks. Selain itu, ia menunjukkan bahawa MusicLM boleh dikondisikan pada kedua-dua teks dan melodi kerana ia boleh mengubah melodi bersiul dan bersenandung mengikut gaya yang diterangkan dalam kapsyen teks. Untuk menyokong penyelidikan masa depan, kami mengeluarkan MusicCaps secara terbuka, set data yang terdiri daripada 5.5k pasangan teks muzik dengan perihalan teks kaya yang disediakan oleh pakar manusia.
Artikel berkaitan: Text-to-3D: Google telah membangunkan rangkaian saraf yang menjana model 3D daripada penerangan teks |
Model MusicLM telah dilatih pada korpus besar skor muzik, yang telah membolehkan AI mempelajari struktur muzik. Model boleh menjana muzik dalam pelbagai genre, termasuk klasik, jazz dan rock. Selain itu, model AI boleh mencipta gubahan asli yang baharu.
Model MusicLM merupakan perkembangan penting dalam bidang muzik yang dijana AI. Model ini mewakili kemajuan yang ketara berbanding model sebelumnya, yang terhad kepada kepingan muzik yang lebih pendek atau hanya mampu menghasilkan melodi mudah. Model baharu ini membuka kemungkinan menggunakan AI untuk menghasilkan karya muzik yang panjang dan kompleks, yang boleh digunakan dalam filem, permainan video atau media lain.
Model AI baharu boleh menjana muzik panjang generasi sehingga lima minit.
Artikel berkaitan: Stable Diffusion boleh mencipta muzik baharu dengan menjana spektrogram berdasarkan teks |
Model AI boleh mencipta muzik menggunakan kapsyen daripada permainan dan filem.
Selain itu, model AI boleh menjana muzik menggunakan imej sebagai input.
Baca lebih lanjut mengenai AI dalam industri muzik:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.
lebih banyak artikelDamir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.