Nyheds rapport Teknologier
Januar 03, 2024

AI Startup MyShell frigiver OpenVoice-algoritmen til præcis stemmekloning

Kort sagt

Den canadiske AI-startup MyShell annoncerede, at den har åbnet sin OpenVoice-algoritme til øjeblikkelig stemmekloning.

AI Startup MyShell frigiver OpenVoice-algoritmen til præcis stemmekloning

Respeecher, Voicemod og ElevenLabs – alle tre startups har én ting til fælles – de leverer alle algoritmer og AI-software til at lave stemmekloner. Nu en ny spiller, canadisk AI-startup MyShell annonceret, at den har åbnet sin OpenVoice-algoritme til øjeblikkelig stemmekloning.

MyShell delte opdateringen den sociale medier platform X og sagde: "Klon stemmer med uovertruffen præcision, med granulær kontrol af tone, fra følelser til accent, rytme, pauser og intonation, kun ved hjælp af et lille lydklip."

Under samarbejdet afslørede forskere fra MIT, MyShell.ai og Tsinghua University OpenVoice, som kan replikere en højttalers stemme og generere tale i Flere sprog, kun ved hjælp af et kort lydstykke fra den originale kilde. Den fanger også den unikke tone og farve af højttalerens stemme.

Ifølge virksomheden tilføjer algoritmen afgørende stilistiske elementer såsom følelser, accent, rytme, pauser og intonation. Disse elementer er afgørende for at få tale til at lyde ægte og skabe interessante samtaler. Det hjælper med at undgå den kedelige lyd, du ofte får med almindelig tekst-til-tale.

Sådan fungerer Voice-Cloning AI-modellen

I en forskningsartikel, delte OpenVoice metoden bag sin stemmekloning AI. OpenVoice er sammensat af to forskellige AI modeller: en tekst-til-tale-model (TTS) og en "tonekonverter".

Modellen kan styre stilparametre og sprog og har gennemgået "træning med 30,000 sætninger" fra engelsk (med både amerikansk og britisk accenter), kinesisk- og japansktalende. Træningen involverede at mærke prøverne baseret på de udtrykte følelser, og modellen lærte intonation, rytme og pauser fra disse lydklip.

På den anden side blev tonekonvertermodellen trænet på et stort datasæt med over 300,000 lydprøver fra mere end 20,000 forskellige højttalere. I begge tilfælde blev menneskelig talelyd konverteret til fonemer - specifikke lyde, der adskiller ord - og repræsenteret ved hjælp af vektorindlejringer.

TTS-modellen, der bruger en "basishøjttaler", kombineres med tonen, der stammer fra en brugers optagede lyd i træningsprocessen. Sammen kan disse to modeller replikere brugerens stemme og ændre tonefarven - det følelsesmæssige udtryk, der formidles i den talte tekst.

Startup'et blev grundlagt i 2023. Sidste år rejste MyShell $5.6 millioner i startfinansiering, ledet af INCE Capital, og så deltagelse af prominente investorer som Folius Ventures, Hashkey Capital, SevenX Ventures, TSVC og OP Crypto, blandt andre.

Ifølge selskabet vil finansieringen hjælpe med at fremme proprietær AI modeller, oprettelsen af ​​et Creator Studio skræddersyet til AI-native apps og etableringen af ​​et levende skaberøkosystem inden for blockchain-teknologiens område.

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Kumar er en erfaren teknisk journalist med speciale i de dynamiske skæringspunkter mellem AI/ML, marketingteknologi og nye områder som krypto, blockchain og NFTs. Med over 3 års erfaring i branchen har Kumar etableret en dokumenteret track record i at skabe overbevisende fortællinger, udføre indsigtsfulde interviews og levere omfattende indsigt. Kumars ekspertise ligger i at producere indhold med stor gennemslagskraft, herunder artikler, rapporter og forskningspublikationer til fremtrædende industriplatforme. Med et unikt færdighedssæt, der kombinerer teknisk viden og historiefortælling, udmærker Kumar sig ved at kommunikere komplekse teknologiske koncepter til forskellige målgrupper på en klar og engagerende måde.

Flere artikler
Kumar Gandharv
Kumar Gandharv

Kumar er en erfaren teknisk journalist med speciale i de dynamiske skæringspunkter mellem AI/ML, marketingteknologi og nye områder som krypto, blockchain og NFTs. Med over 3 års erfaring i branchen har Kumar etableret en dokumenteret track record i at skabe overbevisende fortællinger, udføre indsigtsfulde interviews og levere omfattende indsigt. Kumars ekspertise ligger i at producere indhold med stor gennemslagskraft, herunder artikler, rapporter og forskningspublikationer til fremtrædende industriplatforme. Med et unikt færdighedssæt, der kombinerer teknisk viden og historiefortælling, udmærker Kumar sig ved at kommunikere komplekse teknologiske koncepter til forskellige målgrupper på en klar og engagerende måde.

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
NuLink lancerer på Bybit Web3 IDO platform. Abonnementsfasen forlænges til 13. maj
Markeder Nyheds rapport Teknologier
NuLink lancerer på Bybit Web3 IDO platform. Abonnementsfasen forlænges til 13. maj
Maj 9, 2024
UXLINK og Binance samarbejder om ny kampagne og tilbyder brugerne 20 millioner UXUY-point og Airdrop Belønninger
Markeder Nyheds rapport Teknologier
UXLINK og Binance samarbejder om ny kampagne og tilbyder brugerne 20 millioner UXUY-point og Airdrop Belønninger
Maj 9, 2024
Side Protocol lancerer incitamenteret testnet og introducerer Insider Point System, der gør det muligt for brugere at optjene SIDE Points
Markeder Nyheds rapport Teknologier
Side Protocol lancerer incitamenteret testnet og introducerer Insider Point System, der gør det muligt for brugere at optjene SIDE Points
Maj 9, 2024
Web3 og kryptobegivenheder i maj 2024: Udforskning af nye teknologier og nye tendenser i Blockchain og DeFi
Fordøje Forretning Markeder Teknologier
Web3 og kryptobegivenheder i maj 2024: Udforskning af nye teknologier og nye tendenser i Blockchain og DeFi
Maj 9, 2024