Laporan Berita Teknologi
Jun 26, 2023

Google Memperkenalkan AudioPaLM, Model Bahasa AI yang Berkuasa untuk Penjanaan Pertuturan

Secara ringkas

AudioPaLM ialah model bahasa berkuasa yang dibangunkan oleh Google yang menggabungkan model berasaskan teks dan berasaskan pertuturan untuk pemprosesan pertuturan dan teks yang lancar.

Ia mengekalkan maklumat paralinguistik dan mengatasi sistem sedia ada dalam tugas terjemahan pertuturan.

AudioPaLM boleh menterjemah bahasa beraksen dan melakukan pemindahan suara untuk terjemahan pertuturan ke pertuturan.

Google telah memperkenalkan model bahasa yang dipanggil AudioPaLM, yang menggabungkan model bahasa berasaskan teks dan berasaskan pertuturan untuk memproses dan menjana pertuturan dan teks dengan lancar. Dengan menggabungkan keupayaan PaLM-2 and AudioLM, AudioPaLM menawarkan seni bina multimodal bersatu yang membuka pelbagai aplikasi, termasuk pengecaman pertuturan dan terjemahan pertuturan ke pertuturan.

Google Memperkenalkan AudioPaLM, Model Bahasa Perkasa untuk Penjanaan Pertuturan
Kredit: Metaverse Post (mpost.io)

Satu ciri ketara AudioPaLM ialah keupayaannya untuk mengekalkan maklumat paralinguistik seperti identiti dan intonasi pembesar suara, berkat pengaruh AudioLM. Pada masa yang sama, ia memanfaatkan pengetahuan linguistik yang terdapat dalam model bahasa berasaskan teks seperti PaLM-2. Dengan memulakan AudioPaLM dengan berat model bahasa besar teks sahaja, model ini cemerlang dalam pemprosesan pertuturan, mengambil kesempatan daripada data latihan teks yang meluas yang digunakan dalam pralatihan.

Keupayaan luar biasa AudioPaLM telah ditunjukkan melalui pelbagai eksperimen. Ia telah mengatasi sistem sedia ada dalam tugas terjemahan pertuturan dan mempamerkan keupayaan untuk melakukan pukulan sifar terjemahan pertuturan ke teks untuk bahasa yang tidak ditemui semasa latihan.

Selain itu, AudioPaLM mempamerkan ciri-ciri model bahasa audio dengan memindahkan suara merentas bahasa berdasarkan gesaan pertuturan pendek.

Google telah membuat contoh keupayaan AudioPaLM tersedia untuk penerokaan. Keupayaan model untuk menterjemah bahasa dengan aksen yang berbeza, seperti Itali dan Jerman, telah menarik minat para penyelidik dan pengguna. Selain itu, kecekapannya dalam melaksanakan pemindahan suara untuk terjemahan pertuturan ke pertuturan membezakannya daripada garis dasar sedia ada, seperti yang disahkan oleh kedua-dua metrik automatik dan penilai manusia.

Model ini sangat baik dalam menterjemah bahasa daripada audio kepada audio dalam bahasa lain, memelihara suara dan emosi seseorang. Menariknya, Apabila menterjemah beberapa bahasa seperti Itali dan Jerman, model ini mempunyai loghat yang ketara, dan apabila menterjemah yang lain, contohnya, Perancis, ia bercakap dengan loghat Amerika yang sempurna.

Model AudioPaLM dengan contoh terjemahan pertuturan ke pertuturan dan pengecaman pertuturan automatik.

Baca lebih lanjut mengenai AI:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

lebih banyak artikel
Damir Yalalov
Damir Yalalov

Damir ialah ketua pasukan, pengurus produk dan editor di Metaverse Post, meliputi topik seperti AI/ML, AGI, LLM, Metaverse dan Web3-bidang berkaitan. Artikelnya menarik khalayak besar lebih sejuta pengguna setiap bulan. Dia nampaknya seorang pakar dengan pengalaman 10 tahun dalam SEO dan pemasaran digital. Damir telah disebut dalam Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto dan penerbitan lain. Dia mengembara antara UAE, Turki, Rusia dan CIS sebagai nomad digital. Damir memperoleh ijazah sarjana muda dalam fizik, yang dia percaya telah memberikannya kemahiran berfikir kritis yang diperlukan untuk berjaya dalam landskap internet yang sentiasa berubah. 

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
Protokol Infrastruktur yang dikuasakan oleh ZKP ZKBase Membuka Pelan Hala Tuju, Merancang Pelancaran Testnet Pada Mei
Laporan Berita Teknologi
Protokol Infrastruktur yang dikuasakan oleh ZKP ZKBase Membuka Pelan Hala Tuju, Merancang Pelancaran Testnet Pada Mei
Semoga 9, 2024
BLOCKCHANCE dan CONF3RENCE Bersatu untuk Terbesar di Jerman Web3 Persidangan di Dortmund
Perniagaan pasaran perisian Cerita dan Ulasan Teknologi
BLOCKCHANCE dan CONF3RENCE Bersatu untuk Terbesar di Jerman Web3 Persidangan di Dortmund
Semoga 9, 2024
NuLink Dilancarkan Pada Bybit Web3 Platform IDO. Fasa Langganan Dilanjutkan Sehingga 13 Mei
pasaran Laporan Berita Teknologi
NuLink Dilancarkan Pada Bybit Web3 Platform IDO. Fasa Langganan Dilanjutkan Sehingga 13 Mei
Semoga 9, 2024
UXLINK Dan Binance Bekerjasama Pada Kempen Baharu, Menawarkan Pengguna 20J Mata UXUY Dan Airdrop Ganjaran
pasaran Laporan Berita Teknologi
UXLINK Dan Binance Bekerjasama Pada Kempen Baharu, Menawarkan Pengguna 20J Mata UXUY Dan Airdrop Ganjaran
Semoga 9, 2024