Google AI Mengumumkan Text-to-Music Generator AudioLM yang Pertama
Singkatnya
AudioLM dapat menghasilkan musik hanya dengan mendengarkan suara
Mubert AI untuk melanjutkan ucapan manusia dan musik piano
Dengan GPT-3 dan lainnya, gagasan AI generatif memiliki peluang bagus untuk maju. Kami juga menemukan konsep inpainting dan outpainting; AI dengan terampil melengkapi gambar dengan tetap menjaga tema dan gaya. Bagaimana dengan musik?
Dan lagi! Karena semua ini didasarkan pada model bahasa AI yang mempertahankan makna, hanya masalah waktu sebelum teknologi ini diterapkan pada musik. Dan sekarang waktunya telah tiba.
Menurut penelitian Google baru-baru ini, kerangka kerja baru untuk produksi audio yang disebut AudioLM dapat diajarkan untuk menciptakan musik piano dan ucapan yang realistis hanya dengan mendengarkan suara. Karena konsistensi jangka panjang dan fidelitasnya yang luar biasa, AudioLM melampaui sistem sebelumnya dan memajukan pembuatan audio dengan aplikasi dalam sintesis suara dan musik dengan bantuan komputer.
AudioLM dari Google AI dapat memperluas bagian akustik sambil mempertahankan "niat". Sampai sekarang, telah dilatih untuk melanjutkan ucapan manusia dan musik piano, berdasarkan sampel input data yang terbatas. Periksa sampel di bawah ini.
Kriteria ucapannya langsung: Pendengar diminta untuk menilai apakah kelanjutannya terdengar seperti ucapan manusia. Dengan musik, ditemukan bahwa "kelanjutan" dari bagian yang disediakan untuk input jauh lebih unggul dalam kualitas daripada semua generator musik saat ini dari awal, seperti Kotak Juke. Dengan sugesti pada input, AI melanjutkan musik dengan jauh lebih baik.
Penilai manusia mendengarkan sampel audio untuk mengonfirmasi hasilnya. Mereka menentukan apakah mereka mendengar kelanjutan nyata dari suara manusia yang telah direkam atau suara buatan yang diproduksi oleh AudioLM. Data mereka menunjukkan tingkat keberhasilan 51.2%. Akibatnya, akan sulit bagi pendengar rata-rata untuk membedakan antara ucapan yang dihasilkan oleh AudioLM dan ucapan manusia yang sebenarnya.
Apakah teknologi teks-ke-musik mengubah bisnis musik?
Generator teks-ke-musik berdasarkan API Mubert baru-baru ini diumumkan oleh model AI lainnya, Mubert. Mubert menciptakan serangkaian suara berbeda untuk setiap permintaan yang Anda kirimkan. Kemungkinan terulangnya kembali sangat kecil. Musik dibuat ketika permintaan dibuat; itu tidak diambil dari database lagu yang sudah jadi. Benar sekali generatif musik ini ini adalah pertanyaan umum.
Suara dipilih sebelum dibuat. Prompt input dan tag API Mubert dikodekan ke vektor ruang laten jaringan saraf transformator. Vektor tag terdekat untuk setiap kueri kemudian dipilih, dan tag yang menyertainya dikirim ke API kami untuk membuat musik. Tidak ada jaringan saraf yang digunakan untuk membuat suara apa pun (loop terpisah untuk bass, lead, dll.); semua suara diproduksi oleh musisi dan perancang suara.
Langkah penting Mubert selanjutnya adalah mengambil item dari dunia saat ini, seperti foto, film, skenario, dan presentasi, dan menciptakan musik dunia di sekitar Anda.
Inilah yang bisa Anda dapatkan dengan sembarangan memasukkan petunjuk teks ke mulut musikal Mubert AI:
Ini adalah tahap awal dalam proses membangun algoritma penghasil yang lebih canggih dan tepat, tetapi ini akan memakan waktu dan uang.
Namun, teknologi teks-ke-musik sudah tersedia, sehingga Anda dapat membuat album secara massal dengan mengganti "input prompt" menjadi "write a random prompt script". Sepertinya artis tidak lagi dibutuhkan.
Baca berita terkait lainnya:
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.
lebih artikelDamir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.