VALL-E: Model teks-ke-ucapan sifar tangkapan baharu Microsoft boleh menduplikasi suara semua orang dalam masa tiga saat
Secara ringkas
Dengan hanya sampel tiga saat mana-mana suara, model TTS berasaskan pengubah VALL-E boleh menghasilkan pertuturan dalam setiap suara.
Ini merupakan kemajuan ketara ke arah sistem TTS yang lebih bunyi semula jadi.
Walau bagaimanapun, Microsoft telah menyediakan beberapa sampel model yang sedang digunakan, dan terbukti bahawa ini mewakili perkembangan penting dalam teknologi TTS.
Sejak keluaran model text-to-speech (TTS) yang pertama, penyelidik telah mencari cara untuk memperbaiki cara sistem ini menjana pertuturan. Model terbaru dari Microsoft, LEMBAH, merupakan satu langkah ke hadapan yang penting dalam hal ini.
VALL-E ialah model TTS berasaskan pengubah yang boleh menjana pertuturan dalam sebarang suara selepas hanya mendengar sampel tiga saat suara itu. Ini merupakan peningkatan yang ketara berbanding model sebelumnya, yang memerlukan tempoh latihan yang lebih lama untuk menjana suara baharu.
Artikel berkaitan: Microsoft telah mengeluarkan model penyebaran yang boleh membina avatar 3D daripada satu foto seseorang |
Selain itu, intonasi, karisma dan gaya suara semuanya dikekalkan dalam pertuturan yang dihasilkan. Ini adalah langkah penting ke hadapan dalam menjadikan sistem TTS terdengar lebih semula jadi.
Model ini berasaskan pengubah dan mempunyai rupa Dale-1. Jangan dikelirukan dengan Dalle-2 berasaskan resapan. Kod masih kurang. Dan pengguna mempunyai beberapa keraguan bahawa mereka akan menyiarkannya.
Artikel berkaitan: VALL-E Microsoft nampaknya merupakan perisian penipuan paling berbahaya yang pernah ada |
Walau bagaimanapun, Microsoft telah mengeluarkan beberapa contoh model dalam tindakan, dan jelas bahawa ini adalah kemajuan besar dalam teknologi TTS.
Contoh #1:
Contoh #2:
Contoh #3:
Baca lebih lanjut mengenai AI:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.
lebih banyak artikelDamir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.