Novinky Technika
Ledna 08, 2023

VALL-E: Nový model převodu textu na řeč s nulovým snímkem od společnosti Microsoft dokáže duplikovat hlas každého během tří sekund

Stručně

Model TTS založený na transformátoru s pouhým třísekundovým vzorkem jakéhokoli hlasu VALL-E dokáže produkovat řeč každým hlasem.

Jedná se o významný pokrok směrem k přirozeněji znějícím systémům TTS.

Společnost Microsoft však poskytla několik vzorků používaného modelu a je zřejmé, že to představuje významný vývoj v technologii TTS.

Od vydání prvního modelu převodu textu na řeč (TTS) výzkumníci hledali způsoby, jak zlepšit způsob, jakým tyto systémy generují řeč. Nejnovější model od společnosti Microsoft, ÚDOLÍ, je v tomto ohledu významným krokem vpřed.

VALL-E je model TTS založený na transformátoru, který dokáže generovat řeč v jakémkoli hlase poté, co zaslechne pouze třísekundový vzorek tohoto hlasu. Jde o výrazné zlepšení oproti předchozím modelům, které vyžadovaly mnohem delší dobu školení, aby bylo možné vytvořit nový hlas.

VALL-E je úžasný technologický počin, který má potenciál změnit způsob, jakým pracujeme s digitálními médii.
Související článek: Microsoft vydal difúzní model, který dokáže sestavit 3D avatara z jediné fotografie člověka

Intonace, charisma a styl hlasu jsou navíc v generovaném projevu zachovány. Jedná se o důležitý krok vpřed při vytváření přirozenějšího zvuku systémů TTS.

Tento model je založen na transformátoru a má vzhled Dale-1. Nesmí být zaměňována s difuzně založeným Dalle-2. Kód stále chybí. A uživatelé mají určitou skepsi, že to zveřejní.

Související článek: Microsoft VALL-E se zdá být nejnebezpečnějším podvodným softwarem vůbec

Microsoft však uvolnil pár ukázek modelu v akci a je jasné, že jde o zásadní pokrok v technologii TTS.

Příklad #1:

Příklad č.2:

Příklad #3:

Přečtěte si více o AI:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více

Zakladatelé peněženky Samourai byli obviněni z usnadňování 2 miliard dolarů v obchodech Darknet

Obavy zakladatelů Peněženky Samourai představují pro průmysl významnou překážku, která podtrhuje přetrvávající ...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
AI Wiki Novinky Vývoj Technika
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
2
Člen hongkongské legislativní rady Wu Jiezhuang signalizuje civilní žalobu proti krypto burze JPEX
Business Novinky Technika
Člen hongkongské legislativní rady Wu Jiezhuang signalizuje civilní žalobu proti krypto burze JPEX
2
AltLayer vstupuje do druhé fáze své vytyčovací iniciativy a představuje token realALT
Trhy Novinky Technika
AltLayer vstupuje do druhé fáze své vytyčovací iniciativy a představuje token realALT
2
Řetězec BNB zveřejnil zprávu za 1. čtvrtletí 2024, zdůrazňuje 55.8% snížení ztráty hodnoty, zatímco BSC TVL stoupá o 70.8 %
Trhy Novinky Technika
Řetězec BNB zveřejnil zprávu za 1. čtvrtletí 2024, zdůrazňuje 55.8% snížení ztráty hodnoty, zatímco BSC TVL stoupá o 70.8 %
2
CRYPTOMERIA LABS PTE. LTD.