Ziņojums Tehnoloģija
Jūnijs 26, 2023

Google iepazīstina ar AudioPaLM — jaudīgu AI valodas modeli runas ģenerēšanai

Īsumā

AudioPaLM ir spēcīgs valodas modelis, ko izstrādājis google kas apvieno uz tekstu un runu balstītus modeļus netraucētai runas un teksta apstrādei.

Tas saglabā paralingvistisko informāciju un pārspēj esošās sistēmas runas tulkošanas uzdevumos.

AudioPaLM var tulkot valodas ar akcentiem un veikt balss pārsūtīšanu runas tulkošanai runā.

Google ir atklājis valodas modeli ar nosaukumu AudioPaLM, kas apvieno uz tekstu un runu balstītus valodu modeļus, lai netraucēti apstrādātu un ģenerētu runu un tekstu. Apvienojot iespējas PaLM-2 un AudioLM, AudioPaLM piedāvā vienotu multimodālu arhitektūru, kas paver plašu lietojumu klāstu, tostarp runas atpazīšanu un runas tulkošanu runā.

Google iepazīstina ar AudioPaLM — jaudīgu valodas modeli runas ģenerēšanai
Kredīts: Metaverse Post (mpost.io)

Viena no ievērojamām AudioPaLM iezīmēm ir tā spēja saglabāt paralingvistisko informāciju, piemēram, runātāja identitāti un intonāciju, pateicoties AudioLM ietekmei. Tajā pašā laikā tas izmanto lingvistiskās zināšanas, kas atrodamas teksta valodu modeļos, piemēram, PaLM-2. Inicializējot AudioPaLM ar tikai teksta lielas valodas modeļa svariem, modelis izceļas ar runas apstrādi, izmantojot plašos teksta apmācības datus, ko izmanto iepriekšējai apmācībai.

AudioPaLM ievērojamās iespējas ir pierādītas dažādos eksperimentos. Tas ir pārspējis esošās sistēmas runas tulkošanas uzdevumos un demonstrē spēju veikt nulles attēlu tulkošana no runas uz tekstu valodām, kuras nav sastopamas apmācības laikā.

Turklāt AudioPaLM piedāvā funkcijas audio valodu modeļi pārsūtot balsis dažādās valodās, pamatojoties uz īsiem mutiskiem norādījumiem.

Google ir izveidojis AudioPaLM iespēju piemēri pieejams izpētei. Modeļa spēja tulkot valodas ar skaidriem akcentiem, piemēram, itāļu un vācu valodu, ir ieinteresējusi pētniekus un lietotājus. Turklāt tā prasme veikt balss pārsūtīšanu runas tulkošanai runā atšķir to no esošajām bāzes līnijām, ko apstiprina gan automātiskie rādītāji, gan cilvēku vērtētāji.

Modelis ļoti labi pārvērš valodu no audio uz audio citā valodā, saglabājot cilvēka balsi un emocijas. Interesanti, ka, tulkojot dažas valodas, piemēram, itāļu un vācu, modelim ir jūtams akcents, savukārt, tulkojot citas, piemēram, franču valodu, tas runā ar perfektu amerikāņu akcentu.

AudioPaLM modelis ar runas tulkošanas un automātiskās runas atpazīšanas piemēriem.

Lasiet vairāk par AI:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Vairāk rakstus
Damirs Jalalovs
Damirs Jalalovs

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

Nepastāvības apstākļos institucionālā apetīte pieaug pret Bitcoin ETF

Informācijas atklāšana, izmantojot 13F pieteikumus, atklāj ievērojamus institucionālos investorus, kas iesaistās Bitcoin ETF, uzsverot pieaugošo pieņemšanu ...

Uzziniet vairāk

Pienāk notiesāšanas diena: CZ liktenis ir līdzsvarā, jo ASV tiesa izskata DOJ lūgumu

Šodien ASV tiesā Sietlā Čanpens Džao ir gatavs notiesāt.

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
MPost Pievienojas nozares līderiem kampaņā “Bitcoin ir pelnījis emocijzīmes”, atbalstot Bitcoin simbolu integrāciju katrā virtuālajā tastatūrā
Dzīvesveids Ziņojums Tehnoloģija
MPost Pievienojas nozares līderiem kampaņā “Bitcoin ir pelnījis emocijzīmes”, atbalstot Bitcoin simbolu integrāciju katrā virtuālajā tastatūrā
10. gada 2024. maijs
Kripto birža OKX saraksti Notcoin, ieviesīs tūlītējo tirdzniecību ar NOT-USDT pāri 16. maijā
Markets Ziņojums Tehnoloģija
Kripto birža OKX saraksti Notcoin, ieviesīs tūlītējo tirdzniecību ar NOT-USDT pāri 16. maijā  
10. gada 2024. maijs
Blast uzsāk trešo Blast Gold izplatīšanas notikumu, piešķir 15 miljonus punktu DApps
Markets Ziņojums Tehnoloģija
Blast uzsāk trešo Blast Gold izplatīšanas notikumu, piešķir 15 miljonus punktu DApps
10. gada 2024. maijs
Espresso Systems sadarbojas ar Polygon Labs, lai izstrādātu AggLayer, lai uzlabotu apkopojuma savietojamību
bizness Ziņojums Tehnoloģija
Espresso Systems sadarbojas ar Polygon Labs, lai izstrādātu AggLayer, lai uzlabotu apkopojuma savietojamību
9. gada 2024. maijs
CRYPTOMERIA LABS PTE. LTD.