VALL-E: Model text-to-speech zero-shot baru Microsoft dapat menduplikasi suara semua orang dalam tiga detik
Singkatnya
Hanya dengan sampel suara apa pun selama tiga detik, model TTS berbasis transformator VALL-E dapat menghasilkan ucapan di setiap suara.
Ini adalah kemajuan yang signifikan ke arah sistem TTS yang terdengar lebih natural.
Namun, Microsoft telah memberikan beberapa contoh model yang digunakan, dan terbukti bahwa ini merupakan perkembangan yang signifikan dalam teknologi TTS.
Sejak rilis model text-to-speech (TTS) pertama, para peneliti telah mencari cara untuk meningkatkan cara sistem ini menghasilkan ucapan. Model terbaru dari Microsoft, LEMBAH, merupakan langkah maju yang signifikan dalam hal ini.
VALL-E adalah model TTS berbasis transformator yang dapat menghasilkan ucapan dalam suara apa pun setelah hanya mendengar sampel tiga detik dari suara tersebut. Ini merupakan peningkatan signifikan dibandingkan model sebelumnya, yang membutuhkan periode pelatihan lebih lama untuk menghasilkan suara baru.
Artikel terkait: Microsoft telah merilis model difusi yang dapat membuat avatar 3D dari satu foto seseorang |
Selain itu, intonasi, karisma, dan gaya suara tetap utuh dalam ucapan yang dihasilkan. Ini merupakan langkah maju yang penting dalam membuat sistem TTS terdengar lebih alami.
Model ini berbasis transformator dan memiliki tampilan Dale-1. Jangan bingung dengan Dalle-2 berbasis difusi. Kodenya masih kurang. Dan pengguna memiliki beberapa keraguan bahwa mereka akan mempostingnya.
Artikel terkait: VALL-E Microsoft tampaknya merupakan perangkat lunak penipuan paling berbahaya yang pernah ada |
Namun, Microsoft telah merilis beberapa contoh model yang sedang beraksi, dan jelas bahwa ini merupakan kemajuan besar dalam teknologi TTS.
Contoh #1:
Contoh #2:
Contoh #3:
Baca lebih lanjut tentang AI:
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.
lebih artikelDamir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah.