Model AI Baharu Mensintesis Pertuturan Realistik Menggunakan YouTube dan Podcast
Secara ringkas
Penyelidik dari Universiti Carnegie Mellon telah mencipta model kecerdasan buatan baharu yang mampu menjana pertuturan realistik dengan belajar daripada video YouTube dan podcast.
Model itu dapat mempelajari nuansa corak pertuturan semula jadi dengan mendengar hampir 900 jam kandungan YouTube dan podcast, menghasilkan suara sintetik yang lebih realistik dan seperti hidup.
Penyelidik dari Universiti Carnegie Mellon di Amerika Syarikat telah mencipta model kecerdasan buatan baharu yang mampu menjana pertuturan realistik dengan belajar daripada video dan podcast YouTube. Model ini mampu menghasilkan pertuturan dalam pelbagai suara dan aksen, menjadikannya alat yang berpotensi berguna untuk industri seperti hiburan dan pengiklanan. Ia juga boleh memberi implikasi kepada mereka yang bergantung pada teknologi bantuan untuk berkomunikasi.
Ini merupakan perkembangan yang ketara, kerana majoriti pertuturan yang dijana oleh AI didapati tidak beremosi dan membosankan disebabkan fakta bahawa ia biasanya dilatih pada set data di mana ucapan pelakon profesional direkodkan. Teknologi baharu ini boleh digunakan untuk meningkatkan prestasi pembantu maya dan chatbot, menjadikannya lebih menarik dan seperti manusia. Ia juga mempunyai aplikasi yang berpotensi dalam bidang seperti permainan, pendidikan dan hiburan.
Baca lebih lanjut: 15 Podcast Crypto Terbaik yang Perlu Anda Dengar pada 2023 |
Model baharu itu, bagaimanapun, dapat mempelajari nuansa corak pertuturan semula jadi, seperti jeda, kata seru dan parasit, dengan mendengar hampir 900 jam kandungan YouTube dan podcast. Ini menghasilkan suara sintetik yang lebih realistik dan seperti hidup, yang dinilai 3.89 pada skala lima mata oleh orang yang diminta untuk menilainya. Ini lebih tinggi daripada skor purata yang diterima oleh model AI yang serupa (suara manusia sebenar mendapat markah 4.01).
Potensi aplikasi teknologi ini sangat luas dan termasuk membantu orang yang mengalami masalah pertuturan, menambah baik sistem navigasi dan mencipta lebih banyak pembantu maya yang berbunyi semula jadi.
- PodcastAI ialah podcast pertama yang pernah dihasilkan oleh AI, menampilkan spoof Joe Rogan yang menemu bual Steve Jobs. Podcast ini dibuat sepenuhnya oleh algoritma komputer AI. AI telah dilatih untuk episod Steve Jobs menggunakan kedua-dua biografinya dan sebarang rakaman internet mengenainya yang boleh ditemui. Ini membolehkan AI mencipta semula personalitinya dengan setia.
Baca lebih banyak artikel berkaitan:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.
lebih banyak artikelDamir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.