Tudósítást Technológia
Január 08, 2023

VALL-E: A Microsoft új, nullapontos szövegfelolvasó modellje három másodperc alatt képes lemásolni mindenki hangját

Röviden

Mindössze egy három másodperces hangmintával, a transzformátor alapú TTS-modell A VALL-E minden hangon képes beszédet előállítani.

Ez jelentős előrelépés a természetesebb hangzású TTS-rendszerek irányába.

A Microsoft azonban bemutatott néhány mintát a használatban lévő modellből, és nyilvánvaló, hogy ez jelentős fejlődést jelent a TTS technológia terén.

Az első text-to-speech (TTS) modell megjelenése óta a kutatók keresik a módokat arra, hogy javítsák e rendszerek beszédgenerálását. A Microsoft legújabb modellje, VÖLGY, jelentős előrelépést jelent e tekintetben.

A VALL-E egy transzformátor alapú TTS-modell, amely bármilyen hangon képes beszédet generálni, miután csak egy három másodperces hangmintát hall. Ez jelentős előrelépés a korábbi modellekhez képest, amelyek sokkal hosszabb képzési időszakot igényeltek az új hang generálásához.

VALL-E: A Microsoft új, nullapontos szövegfelolvasó modellje három másodperc alatt képes lemásolni mindenki hangját
A VALL-E egy csodálatos technológiai bravúr, amely képes megváltoztatni a digitális médiával való interakciónkat.
Kapcsolódó cikk: A Microsoft kiadott egy diffúziós modellt, amely egy személy egyetlen fényképéből 3D avatárt tud felépíteni

Ezenkívül a hang intonációja, karizmája és stílusa érintetlen marad a generált beszédben. Ez fontos előrelépés a TTS-rendszerek természetesebb hangzása felé.

VALL-E: A Microsoft új, nullapontos szövegfelolvasó modellje három másodperc alatt képes lemásolni mindenki hangját

Ez a modell transzformátor alapú, és Dale-1 megjelenésű. Nem tévesztendő össze a diffúzió alapú Dalle-2-vel. A kód még mindig hiányzik. A felhasználók pedig szkeptikusak, hogy közzéteszik.

Kapcsolódó cikk: Úgy tűnik, hogy a Microsoft VALL-E a valaha volt legveszélyesebb átverő szoftver

A Microsoft azonban kiadott néhány példát a működő modellről, és nyilvánvaló, hogy ez jelentős előrelépés a TTS technológia terén.

Példa #1:

Példa #2:

Példa #3:

Tudjon meg többet az AI-ról:

Jogi nyilatkozat

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

Hot Stories
Csatlakozzon hírlevelünkhöz.
Legfrissebb hírek

A Solana-vihar előtti csend: Mit mondanak most a grafikonok, a bálnák és a láncon lévő jelek?

A Solana erős teljesítményt mutatott, amelyet a növekvő elfogadás, az intézményi érdeklődés és a kulcsfontosságú partnerségek vezéreltek, miközben potenciális ...

Tudjon meg többet

Kriptovaluták 2025 áprilisában: Főbb trendek, változások és mi következik?

2025 áprilisában a kriptovilág az alapvető infrastruktúra megerősítésére összpontosított, az Ethereum pedig a Pectra ...

Tudjon meg többet
További információk
Részletek
A Nexo többéves névadó szponzorációt szerzett az amerikai ATP 500 Dallas Openen
Tudósítást Technológia
A Nexo többéves névadó szponzorációt szerzett az amerikai ATP 500 Dallas Openen
Január 13, 2026
A Microsoft kiemeli a mesterséges intelligencia terén növekvő szakadékot: az Egyesült Arab Emírségek vezet, az USA lemarad, a DeepSeek pedig terjeszkedik a feltörekvő gazdaságokban
Tudósítást Technológia
A Microsoft kiemeli a mesterséges intelligencia terén növekvő szakadékot: az Egyesült Arab Emírségek vezet, az USA lemarad, a DeepSeek pedig terjeszkedik a feltörekvő gazdaságokban
Január 13, 2026
A Safe andEthena partnerséget kötött az USDe fellendítésére a több aláírású tárcákban
Tudósítást
A Safe andEthena partnerséget kötött az USDe fellendítésére a több aláírású tárcákban
Január 13, 2026
A Google új bevásárlóügynöki platformmal bővíti mesterséges intelligencia által vezérelt kiskereskedelmi képességeit
Vélemény Életmód Tudósítást Technológia
A Google új bevásárlóügynöki platformmal bővíti mesterséges intelligencia által vezérelt kiskereskedelmi képességeit
Január 13, 2026
CRYPTOMERIA LABS PTE. KFT.