Uutisraportti Elektroniikka
Tammikuu 08, 2023

VALL-E: Microsoftin uusi nollasta tekstistä puheeksi -malli voi kopioida kaikkien äänen kolmessa sekunnissa

Lyhyesti

Vain kolmen sekunnin näyte mistä tahansa äänestä, muuntajapohjainen TTS-malli VALL-E voi tuottaa puhetta jokaisella äänellä.

Tämä on merkittävä edistysaskel luonnollisemman kuuloisten TTS-järjestelmien suuntaan.

Microsoft on kuitenkin toimittanut muutamia näytteitä käytössä olevasta mallista, ja on ilmeistä, että tämä edustaa merkittävää kehitystä TTS-tekniikassa.

Ensimmäisen tekstistä puheeksi (TTS) -mallin julkaisusta lähtien tutkijat ovat etsineet tapoja parantaa tapaa, jolla nämä järjestelmät tuottavat puhetta. Microsoftin uusin malli, LAKSO, on merkittävä edistysaskel tässä suhteessa.

VALL-E on muuntajapohjainen TTS-malli, joka voi tuottaa puhetta millä tahansa äänellä kuultuaan vain kolmen sekunnin näytteen kyseisestä äänestä. Tämä on merkittävä parannus aiempiin malleihin, jotka vaativat paljon pidemmän harjoittelujakson uuden äänen synnyttämiseksi.

VALL-E on hämmästyttävä teknologinen saavutus, joka voi muuttaa tapaamme olla vuorovaikutuksessa digitaalisen median kanssa.
Aiheeseen liittyvä artikkeli: Microsoft on julkaissut diffuusiomallin, joka voi rakentaa 3D-avatarin yhdestä henkilön valokuvasta

Lisäksi äänen intonaatio, karisma ja tyyli säilyvät ennallaan generoidussa puheessa. Tämä on tärkeä askel eteenpäin TTS-järjestelmien saamisessa kuulostamaan luonnollisemmilta.

Tämä malli on muuntajapohjainen ja sen ulkonäkö on Dale-1. Ei pidä sekoittaa diffuusiopohjaiseen Dalle-2:een. Koodi puuttuu edelleen. Ja käyttäjät epäilevät, että he julkaisevat sen.

Aiheeseen liittyvä artikkeli: Microsoftin VALL-E näyttää olevan kaikkien aikojen vaarallisin huijausohjelmisto

Microsoft on kuitenkin julkaissut muutaman esimerkin mallista toiminnassa, ja on selvää, että tämä on merkittävä edistysaskel TTS-tekniikassa.

Esimerkki # 1:

Esimerkki #2:

Esimerkki # 3:

Lue lisää tekoälystä:

Vastuun kieltäminen

Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.

Author

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

lisää artikkeleita
Damir Yalalov
Damir Yalalov

Damir on tiimin johtaja, tuotepäällikkö ja toimittaja osoitteessa Metaverse Post, kattaa aiheita, kuten AI/ML, AGI, LLMs, Metaverse ja Web3- liittyvät kentät. Hänen artikkelinsa houkuttelevat yli miljoonan käyttäjän massiivisen yleisön joka kuukausi. Hän näyttää olevan asiantuntija, jolla on 10 vuoden kokemus hakukoneoptimoinnista ja digitaalisesta markkinoinnista. Damir on mainittu Mashablessa, Wiredissä, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muut julkaisut. Hän matkustaa Arabiemiirikuntien, Turkin, Venäjän ja IVY-maiden välillä digitaalisena nomadina. Damir suoritti kandidaatin tutkinnon fysiikasta, jonka hän uskoo antaneen hänelle kriittisen ajattelun taidot menestyäkseen jatkuvasti muuttuvassa internetin maisemassa. 

Institutionaalinen ruokahalu kasvaa kohti Bitcoin ETF:iä volatiliteetin keskellä

13F-hakemusten kautta tehdyt ilmoitukset paljastavat merkittäviä institutionaalisia sijoittajia, jotka harrastavat Bitcoinin ETF:itä, mikä korostaa kasvavaa hyväksyntää ...

Tiedä enemmän

Tuomiopäivä saapuu: CZ:n kohtalo on tasapainossa, kun Yhdysvaltain tuomioistuin harkitsee DOJ:n vetoomusta

Changpeng Zhao odottaa tänään tuomiota Yhdysvaltain oikeudessa Seattlessa.

Tiedä enemmän
Liity innovatiiviseen teknologiayhteisöömme
Lue lisää
Lue lisää
Morph esittelee Holesky Testnet -verkkonsa, jossa on optimistinen zkEVM-integraatio, siltamekanismi ja hajautetut sekvensointiverkkoominaisuudet
Uutisraportti Elektroniikka
Morph esittelee Holesky Testnet -verkkonsa, jossa on optimistinen zkEVM-integraatio, siltamekanismi ja hajautetut sekvensointiverkkoominaisuudet
Voi 6, 2024
Robinhood Crypto saa Wellsin ilmoituksen arvopaperi- ja pörssikomitealta väitetyistä arvopaperirikkomuksista
markkinat Uutisraportti Elektroniikka
Robinhood Crypto saa Wellsin ilmoituksen arvopaperi- ja pörssikomitealta väitetyistä arvopaperirikkomuksista
Voi 6, 2024
QuickSwap otetaan käyttöön X-kerroksen verkkoverkossa ja laajentaa Polygon CDK -verkkoa Citadel-julkaisulla
Uutisraportti Elektroniikka
QuickSwap otetaan käyttöön X-kerroksen verkkoverkossa ja laajentaa Polygon CDK -verkkoa Citadel-julkaisulla 
Voi 6, 2024
Layer 2 Network Linea käynnistää ZeroLendin ZERO Token Claiming For Airdrop Käyttäjät ja sijoittajat
markkinat Uutisraportti Elektroniikka
Layer 2 Network Linea käynnistää ZeroLendin ZERO Token Claiming For Airdrop Käyttäjät ja sijoittajat
Voi 6, 2024
CRYPTOMERIA LABS PTE. OY.