Laporan berita Teknologi
15 Maret, 2023

Model AI Baru Mensintesis Pidato Realistis Menggunakan YouTube dan Podcast

Singkatnya

Para peneliti dari Universitas Carnegie Mellon telah menciptakan model kecerdasan buatan baru yang mampu menghasilkan ucapan realistis dengan belajar dari video YouTube dan podcast.

Model ini dapat mempelajari nuansa pola ucapan alami dengan mendengarkan hampir 900 jam konten YouTube dan podcast, menghasilkan suara sintetis yang lebih realistis dan nyata.

Peneliti dari Universitas Carnegie Mellon di AS telah dibuat model kecerdasan buatan baru yang mampu menghasilkan ucapan realistis dengan belajar dari video dan podcast YouTube. Model ini mampu menghasilkan ucapan dalam berbagai suara dan aksen, menjadikannya alat yang berpotensi berguna untuk industri seperti hiburan dan periklanan. Itu juga bisa berimplikasi pada mereka yang mengandalkan teknologi bantuan untuk berkomunikasi.

Model AI baru mensintesis ucapan realistis menggunakan YouTube dan podcast
Model AI mampu meniru pola dan intonasi ucapan manusia dengan akurasi tinggi.

Ini adalah perkembangan yang signifikan, karena sebagian besar ucapan yang dihasilkan AI ternyata tidak memiliki emosi dan monoton karena biasanya dilatih pada kumpulan data tempat ucapan aktor profesional direkam. Teknologi baru ini dapat digunakan untuk meningkatkan kinerja asisten virtual dan chatbot, menjadikannya lebih menarik dan mirip manusia. Ini juga memiliki aplikasi potensial di bidang-bidang seperti game, pendidikan, dan hiburan.

Baca lebih lanjut: 15 Podcast Crypto Terbaik yang Perlu Anda Dengarkan di Tahun 2023

Model baru, bagaimanapun, dapat mempelajari nuansa pola ucapan alami, seperti jeda, kata seru, dan kata-kata parasit, dengan mendengarkan hampir 900 jam konten YouTube dan podcast. Ini menghasilkan suara sintetis yang lebih realistis dan hidup, yang diberi peringkat 3.89 pada skala lima poin oleh orang yang diminta untuk mengevaluasinya. Ini lebih tinggi dari skor rata-rata yang diterima oleh model AI serupa (skor suara manusia asli 4.01).

Aplikasi potensial dari teknologi ini sangat luas dan termasuk membantu orang dengan gangguan bicara, meningkatkan sistem navigasi, dan membuat asisten virtual yang terdengar lebih natural.

  • PodcastAI adalah podcast pertama yang diproduksi oleh AI, menampilkan lelucon Joe Rogan yang mewawancarai Steve Jobs. Podcast ini seluruhnya dibuat oleh algoritme komputer AI. AI dilatih untuk episode Steve Jobs menggunakan biografinya dan rekaman internet apa pun tentang dirinya yang dapat ditemukan. Ini memungkinkan AI untuk dengan setia menciptakan kembali kepribadiannya.

Baca artikel terkait lainnya:

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

lebih artikel
Damir Yalalov
Damir Yalalov

Damir adalah pemimpin tim, manajer produk, dan editor di Metaverse Post, mencakup topik seperti AI/ML, AGI, LLM, Metaverse, dan Web3-bidang terkait. Artikelnya menarik lebih dari satu juta pengguna setiap bulan. Dia tampaknya ahli dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebutkan dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, dan publikasi lainnya. Dia melakukan perjalanan antara UEA, Turki, Rusia, dan CIS sebagai pengembara digital. Damir memperoleh gelar sarjana dalam bidang fisika, yang menurutnya telah memberinya keterampilan berpikir kritis yang diperlukan untuk berhasil dalam lanskap internet yang selalu berubah. 

Hot Stories
Bergabunglah dengan Buletin Kami.
Berita Terkini

Kegilaan DOGE: Menganalisis Lonjakan Nilai Dogecoin (DOGE) Baru-baru ini

Industri mata uang kripto berkembang pesat, dan koin meme sedang bersiap untuk peningkatan yang signifikan. Dogecoin (DOGE), ...

Tahu lebih banyak

Evolusi Konten Buatan AI di Metaverse

Munculnya konten AI generatif adalah salah satu perkembangan paling menarik dalam lingkungan virtual ...

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
Scroll Menyelesaikan Peningkatan Mainnet Bernoulli, Mengantisipasi Penurunan Biaya Transaksi 10x
Laporan berita Teknologi
Scroll Menyelesaikan Peningkatan Mainnet Bernoulli, Mengantisipasi Penurunan Biaya Transaksi 10x
29 April, 2024
OKX Jumpstart Mencantumkan Runecoin, Memungkinkan Staking BTC Untuk Menghasilkan Token RUNE
pasar Laporan berita Teknologi
OKX Jumpstart Mencantumkan Runecoin, Memungkinkan Staking BTC Untuk Menghasilkan Token RUNE
29 April, 2024
Penawaran Teratas Minggu Ini, Investasi Besar dalam AI, IT, Web3, dan Kripto (22-26.04)
intisari Bisnis pasar Teknologi
Penawaran Teratas Minggu Ini, Investasi Besar dalam AI, IT, Web3, dan Kripto (22-26.04)
26 April, 2024
Vitalik Buterin Mengomentari Sentralisasi PoW, Catatan Itu Tahap Sementara Hingga PoS
Laporan berita Teknologi
Vitalik Buterin Mengomentari Sentralisasi PoW, Catatan Itu Tahap Sementara Hingga PoS
26 April, 2024