Google Memperkenalkan AudioPaLM, Model Bahasa AI yang Berkuasa untuk Penjanaan Pertuturan
Secara ringkas
AudioPaLM ialah model bahasa berkuasa yang dibangunkan oleh Google yang menggabungkan model berasaskan teks dan berasaskan pertuturan untuk pemprosesan pertuturan dan teks yang lancar.
Ia mengekalkan maklumat paralinguistik dan mengatasi sistem sedia ada dalam tugas terjemahan pertuturan.
AudioPaLM boleh menterjemah bahasa beraksen dan melakukan pemindahan suara untuk terjemahan pertuturan ke pertuturan.
Google telah memperkenalkan model bahasa yang dipanggil AudioPaLM, yang menggabungkan model bahasa berasaskan teks dan berasaskan pertuturan untuk memproses dan menjana pertuturan dan teks dengan lancar. Dengan menggabungkan keupayaan PaLM-2 and AudioLM, AudioPaLM menawarkan seni bina multimodal bersatu yang membuka pelbagai aplikasi, termasuk pengecaman pertuturan dan terjemahan pertuturan ke pertuturan.
Satu ciri ketara AudioPaLM ialah keupayaannya untuk mengekalkan maklumat paralinguistik seperti identiti dan intonasi pembesar suara, berkat pengaruh AudioLM. Pada masa yang sama, ia memanfaatkan pengetahuan linguistik yang terdapat dalam model bahasa berasaskan teks seperti PaLM-2. Dengan memulakan AudioPaLM dengan berat model bahasa besar teks sahaja, model ini cemerlang dalam pemprosesan pertuturan, mengambil kesempatan daripada data latihan teks yang meluas yang digunakan dalam pralatihan.
Keupayaan luar biasa AudioPaLM telah ditunjukkan melalui pelbagai eksperimen. Ia telah mengatasi sistem sedia ada dalam tugas terjemahan pertuturan dan mempamerkan keupayaan untuk melakukan pukulan sifar terjemahan pertuturan ke teks untuk bahasa yang tidak ditemui semasa latihan.
Selain itu, AudioPaLM mempamerkan ciri-ciri model bahasa audio dengan memindahkan suara merentas bahasa berdasarkan gesaan pertuturan pendek.
Google telah membuat contoh keupayaan AudioPaLM tersedia untuk penerokaan. Keupayaan model untuk menterjemah bahasa dengan aksen yang berbeza, seperti Itali dan Jerman, telah menarik minat para penyelidik dan pengguna. Selain itu, kecekapannya dalam melaksanakan pemindahan suara untuk terjemahan pertuturan ke pertuturan membezakannya daripada garis dasar sedia ada, seperti yang disahkan oleh kedua-dua metrik automatik dan penilai manusia.
Model ini sangat baik dalam menterjemah bahasa daripada audio kepada audio dalam bahasa lain, memelihara suara dan emosi seseorang. Menariknya, Apabila menterjemah beberapa bahasa seperti Itali dan Jerman, model ini mempunyai loghat yang ketara, dan apabila menterjemah yang lain, contohnya, Perancis, ia bercakap dengan loghat Amerika yang sempurna.
Baca lebih lanjut mengenai AI:
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.
lebih banyak artikelDamir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah.