Novice Tehnologija
Januar 08, 2023

VALL-E: Microsoftov novi zero-shot model besedila v govor lahko podvoji glas vsakogar v treh sekundah

Na kratko

S samo tremi sekundami vzorca katerega koli glasu, transformatorski model TTS VALL-E lahko ustvari govor v vsakem glasu.

To je pomemben napredek v smeri bolj naravno zvenečih sistemov TTS.

Vendar pa je Microsoft zagotovil nekaj vzorcev modela v uporabi in očitno je, da to predstavlja pomemben napredek v tehnologiji TTS.

Od izdaje prvega modela besedila v govor (TTS) raziskovalci iščejo načine za izboljšanje načina, kako ti sistemi ustvarjajo govor. Najnovejši model podjetja Microsoft, DOLINA, je v tem pogledu pomemben korak naprej.

VALL-E je model TTS na osnovi transformatorja, ki lahko ustvari govor v katerem koli glasu, potem ko sliši le trisekundni vzorec tega glasu. To je precejšnja izboljšava v primerjavi s prejšnjimi modeli, ki so zahtevali veliko daljše obdobje usposabljanja, da bi ustvarili nov glas.

VALL-E je neverjeten tehnološki podvig, ki lahko spremeni naš način interakcije z digitalnimi mediji.
Povezani članek: Microsoft je izdal difuzijski model, ki lahko sestavi 3D avatar iz ene fotografije osebe

Poleg tega so intonacija, karizma in slog glasu v ustvarjenem govoru ohranjeni nedotaknjeni. To je pomemben korak naprej pri bolj naravnem zvoku sistemov TTS.

Ta model temelji na transformatorju in ima videz Dale-1. Ne sme se zamenjati z difuzijskim Dalle-2. Koda še vedno manjka. In uporabniki so nekoliko skeptični, da ga bodo objavili.

Povezani članek: Zdi se, da je Microsoftov VALL-E najnevarnejša programska oprema za prevare doslej

Vendar je Microsoft izdal nekaj primerov modela v akciji in jasno je, da je to velik napredek v tehnologiji TTS.

Primer #1:

Primer #2:

Primer #3:

Preberite več o AI:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem

Ustanovitelji denarnice Samourai Wallet obtoženi omogočanja 2 milijard dolarjev pri poslih Darknet

Zaskrbljenost ustanoviteljev denarnice Samourai Wallet predstavlja opazno nazadovanje za industrijo, ki poudarja vztrajno ...

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Googlov Med-Gemini pripravljen dati prednost GPT-4 S svojim vrhunskim delovanjem v zdravstvu
AI Wiki Novice Software Tehnologija
Googlov Med-Gemini pripravljen dati prednost GPT-4 S svojim vrhunskim delovanjem v zdravstvu
Maj 2, 2024
Član zakonodajnega sveta Hongkonga Wu Jiezhuang napoveduje civilno tožbo proti kripto borzi JPEX
ŽELITE POSTATI PARTNER Novice Tehnologija
Član zakonodajnega sveta Hongkonga Wu Jiezhuang napoveduje civilno tožbo proti kripto borzi JPEX
Maj 2, 2024
AltLayer vstopa v drugo fazo svoje pobude za vlaganje, predstavlja žeton reALT
Prisotnost Novice Tehnologija
AltLayer vstopa v drugo fazo svoje pobude za vlaganje, predstavlja žeton reALT
Maj 2, 2024
BNB Chain objavlja poročilo za prvo četrtletje 1, v katerem poudarja 2024-odstotno zmanjšanje svoje izgube vrednosti, medtem ko BSC TVL naraste za 55.8 %
Prisotnost Novice Tehnologija
BNB Chain objavlja poročilo za prvo četrtletje 1, v katerem poudarja 2024-odstotno zmanjšanje svoje izgube vrednosti, medtem ko BSC TVL naraste za 55.8 %
Maj 2, 2024
CRYPTOMERIA LABS PTE. LTD.