Laporan berita
Oktober 21, 2022

Google AI Mengumumkan Text-to-Music Generator AudioLM yang Pertama

Singkatnya

AudioLM dapat menghasilkan musik hanya dengan mendengarkan suara

Mubert AI untuk melanjutkan ucapan manusia dan musik piano

Dengan GPT-3 dan lainnya, gagasan AI generatif memiliki peluang bagus untuk maju. Kami juga menemukan konsep inpainting dan outpainting; AI dengan terampil melengkapi gambar dengan tetap menjaga tema dan gaya. Bagaimana dengan musik?

Dan lagi! Karena semua ini didasarkan pada model bahasa AI yang mempertahankan makna, hanya masalah waktu sebelum teknologi ini diterapkan pada musik. Dan sekarang waktunya telah tiba.

Google AI mengumumkan pembuat teks-ke-musik AudioLM yang pertama

Menurut penelitian Google baru-baru ini, kerangka kerja baru untuk produksi audio yang disebut AudioLM dapat diajarkan untuk menciptakan musik piano dan ucapan yang realistis hanya dengan mendengarkan suara. Karena konsistensi jangka panjang dan fidelitasnya yang luar biasa, AudioLM melampaui sistem sebelumnya dan memajukan pembuatan audio dengan aplikasi dalam sintesis suara dan musik dengan bantuan komputer.

Kami telah mengembangkan sistem untuk mengenali suara sintetis yang dihasilkan AudioLM menggunakan konsep AI yang sama yang mendukung pembuatan model kami sebelumnya.

AudioLM dari Google AI dapat memperluas bagian akustik sambil mempertahankan "niat". Sampai sekarang, telah dilatih untuk melanjutkan ucapan manusia dan musik piano, berdasarkan sampel input data yang terbatas. Periksa sampel di bawah ini.

Kriteria ucapannya langsung: Pendengar diminta untuk menilai apakah kelanjutannya terdengar seperti ucapan manusia. Dengan musik, ditemukan bahwa "kelanjutan" dari bagian yang disediakan untuk input jauh lebih unggul dalam kualitas daripada semua generator musik saat ini dari awal, seperti Kotak Juke. Dengan sugesti pada input, AI melanjutkan musik dengan jauh lebih baik.

Google AI mengumumkan pembuat teks-ke-musik AudioLM yang pertama

Penilai manusia mendengarkan sampel audio untuk mengonfirmasi hasilnya. Mereka menentukan apakah mereka mendengar kelanjutan nyata dari suara manusia yang telah direkam atau suara buatan yang diproduksi oleh AudioLM. Data mereka menunjukkan tingkat keberhasilan 51.2%. Akibatnya, akan sulit bagi pendengar rata-rata untuk membedakan antara ucapan yang dihasilkan oleh AudioLM dan ucapan manusia yang sebenarnya.

Apakah teknologi teks-ke-musik mengubah bisnis musik?

Generator teks-ke-musik berdasarkan API Mubert baru-baru ini diumumkan oleh model AI lainnya, Mubert. Mubert menciptakan serangkaian suara berbeda untuk setiap permintaan yang Anda kirimkan. Kemungkinan terulangnya kembali sangat kecil. Musik dibuat ketika permintaan dibuat; itu tidak diambil dari database lagu yang sudah jadi. Benar sekali generatif musik ini ini adalah pertanyaan umum.

Apakah teknologi teks-ke-musik mengubah bisnis musik?

Suara dipilih sebelum dibuat. Prompt input dan tag API Mubert dikodekan ke vektor ruang laten jaringan saraf transformator. Vektor tag terdekat untuk setiap kueri kemudian dipilih, dan tag yang menyertainya dikirim ke API kami untuk membuat musik. Tidak ada jaringan saraf yang digunakan untuk membuat suara apa pun (loop terpisah untuk bass, lead, dll.); semua suara diproduksi oleh musisi dan perancang suara.

Langkah penting Mubert selanjutnya adalah mengambil item dari dunia saat ini, seperti foto, film, skenario, dan presentasi, dan menciptakan musik dunia di sekitar Anda.

Inilah yang bisa Anda dapatkan dengan sembarangan memasukkan petunjuk teks ke mulut musikal Mubert AI:

Ini adalah tahap awal dalam proses membangun algoritma penghasil yang lebih canggih dan tepat, tetapi ini akan memakan waktu dan uang.

Namun, teknologi teks-ke-musik sudah tersedia, sehingga Anda dapat membuat album secara massal dengan mengganti "input prompt" menjadi "write a random prompt script". Sepertinya artis tidak lagi dibutuhkan.

Baca berita terkait lainnya:

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

lebih artikel
Damir Yalalov
Damir Yalalov

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

Selera Institusional Tumbuh Terhadap ETF Bitcoin Di Tengah Volatilitas

Pengungkapan melalui pengajuan 13F mengungkapkan investor institusi terkemuka yang mencoba-coba ETF Bitcoin, menggarisbawahi semakin besarnya penerimaan ...

Tahu lebih banyak

Hari Hukuman Tiba: Nasib CZ Digantung Saat Pengadilan AS Mempertimbangkan Permohonan DOJ

Changpeng Zhao siap menghadapi hukuman di pengadilan AS di Seattle hari ini.

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
Injective Bergabung Dengan AltLayer Untuk Membawa Keamanan Ulang ke inEVM
Bisnis Laporan berita Teknologi
Injective Bergabung Dengan AltLayer Untuk Membawa Keamanan Ulang ke inEVM
3 Mei 2024
Masa Bekerja Sama Dengan Teller Untuk Memperkenalkan MASA Lending Pool, Memungkinkan Pinjaman USDC Di Pangkalan
pasar Laporan berita Teknologi
Masa Bekerja Sama Dengan Teller Untuk Memperkenalkan MASA Lending Pool, Memungkinkan Pinjaman USDC Di Pangkalan
3 Mei 2024
Velodrome Meluncurkan Versi Beta Superchain Dalam Beberapa Minggu Mendatang Dan Memperluas Di Seluruh Blockchain OP Stack Layer 2
pasar Laporan berita Teknologi
Velodrome Meluncurkan Versi Beta Superchain Dalam Beberapa Minggu Mendatang Dan Memperluas Di Seluruh Blockchain OP Stack Layer 2
3 Mei 2024
CARV Mengumumkan Kemitraan Dengan Aethir Untuk Mendesentralisasikan Lapisan Datanya Dan Mendistribusikan Hadiah
Bisnis Laporan berita Teknologi
CARV Mengumumkan Kemitraan Dengan Aethir Untuk Mendesentralisasikan Lapisan Datanya Dan Mendistribusikan Hadiah
3 Mei 2024