Tudósítást Technológia
Június 26, 2023

A Google bemutatja az AudioPaLM-ot, a beszédgeneráláshoz szükséges hatékony mesterséges intelligencia nyelvi modellt

Röviden

Az AudioPaLM egy erőteljes nyelvi modell, amelyet az Google amely szöveg- és beszédalapú modelleket kombinál a zökkenőmentes beszéd- és szövegfeldolgozás érdekében.

Megőrzi a paralingvisztikai információkat, és felülmúlja a meglévő rendszereket a beszédfordítási feladatokban.

Az AudioPaLM képes lefordítani az ékezetes nyelveket, és hangátvitelt végez a beszéd-beszéd fordításhoz.

A Google bemutatta az úgynevezett nyelvi modellt AudioPaLM, amely szöveg- és beszédalapú nyelvi modelleket kombinál a beszéd és szöveg zökkenőmentes feldolgozása és generálása érdekében. A képességek összevonásával PaLM-2 és a AudioLMAz AudioPaLM egységes multimodális architektúrát kínál, amely számos alkalmazást nyit meg, beleértve a beszédfelismerést és a beszéd-beszéd fordítást.

A Google bemutatja az AudioPaLM-ot, a beszédgenerálás hatékony nyelvi modelljét
jóváírás: Metaverse Post (mpost.io)

Az AudioPaLM egyik figyelemre méltó tulajdonsága, hogy az AudioLM hatásának köszönhetően képes megőrizni a paralingvisztikai információkat, például a beszélő azonosságát és intonációját. Ugyanakkor hasznosítja a szövegalapú nyelvi modellekben, például a PaLM-2-ben található nyelvi ismereteket. Az AudioPaLM inicializálásával egy csak szöveget tartalmazó nagy nyelvi modell súlyaival a modell a beszédfeldolgozásban jeleskedik, kihasználva az előképzésben használt kiterjedt szövegtanítási adatokat.

Az AudioPaLM figyelemre méltó képességeit különféle kísérletek igazolták. A beszédfordítási feladatokban felülmúlta a meglévő rendszereket, és bemutatja a nulla lövés végrehajtásának képességét beszéd-szöveg fordítás olyan nyelvekre, amelyekkel a képzés során nem találkoztunk.

Ezenkívül az AudioPaLM a következő jellemzőit mutatja be hangnyelvi modellek a hangok nyelvek közötti átvitelével rövid beszédhangok alapján.

A Google megtette példák az AudioPaLM képességeire feltárásra elérhető. A modell azon képessége, hogy különböző ékezetes nyelveket, például olaszt és németet lefordít, felkeltette a kutatók és a felhasználók érdeklődését. Ezenkívül a beszéd-beszéd fordításhoz szükséges hangátvitelben való jártassága megkülönbözteti a meglévő alapvonalaktól, amint azt mind az automatikus mérőszámok, mind az emberi értékelők megerősítik.

A modell nagyon jól képes lefordítani egy nyelvet hangról egy másik nyelvű hangra, megőrzi az ember hangját és érzelmeit. Érdekes módon egyes nyelvek, például olasz és német fordítása során a modell markáns akcentussal rendelkezik, míg mások, például a francia fordításakor tökéletes amerikai akcentussal beszél.

Az AudioPaLM modell a beszéd-beszéd fordítás és az automatikus beszédfelismerés példáival.

Tudjon meg többet az AI-ról:

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

A volatilitás közepette nő az intézményi étvágy a Bitcoin ETF-ek felé

A 13F bejelentéseken keresztül közzétett információk jelentős intézményi befektetőket tárnak fel a Bitcoin ETF-ek iránt, ami alátámasztja a ...

Tudjon meg többet

Elérkezett az ítélethirdetés napja: CZ sorsa egyensúlyban van, mivel az Egyesült Államok bírósága mérlegeli a DOJ kérelmét

Changpeng Zhao ítéletet vár ma egy seattle-i amerikai bíróságon.

Tudjon meg többet
Csatlakozzon innovatív technológiai közösségünkhöz
KATT ide
Tovább
A ZKP-alapú infrastruktúra protokoll A ZKBase bemutatja az ütemtervet, a Testnet májusban történő elindítását tervezi
Tudósítást Technológia
A ZKP-alapú infrastruktúra protokoll A ZKBase bemutatja az ütemtervet, a Testnet májusban történő elindítását tervezi
May 9, 2024
BLOCKCHANCE és CONF3RENCE Egyesüljön Németország legnagyobbjain Web3 Konferencia Dortmundban
üzleti piacok szoftver Történetek és vélemények Technológia
BLOCKCHANCE és CONF3RENCE Egyesüljön Németország legnagyobbjain Web3 Konferencia Dortmundban
May 9, 2024
A NuLink elindul a Bybiten Web3 IDO platform. Az előfizetési szakasz május 13-ig meghosszabbodik
piacok Tudósítást Technológia
A NuLink elindul a Bybiten Web3 IDO platform. Az előfizetési szakasz május 13-ig meghosszabbodik
May 9, 2024
Az UXLINK és a Binance együttműködik egy új kampányban, 20 millió UXUY pontot és Airdrop Jutalmak
piacok Tudósítást Technológia
Az UXLINK és a Binance együttműködik egy új kampányban, 20 millió UXUY pontot és Airdrop Jutalmak
May 9, 2024
CRYPTOMERIA LABS PTE. KFT.