Novice Tehnologija
Januar 03, 2024

AI Startup MyShell izda algoritem OpenVoice za natančno kloniranje glasu

Na kratko

Kanadsko zagonsko podjetje AI MyShell je objavilo, da je odprlo svoj algoritem OpenVoice za takojšnje kloniranje glasu.

AI Startup MyShell izda algoritem OpenVoice za natančno kloniranje glasu

Respeecher, Voicemod in ElevenLabs – vsi trije startupi imajo eno skupno stvar – vsi zagotavljajo algoritme in programsko opremo AI za izdelavo glasovnih klonov. Zdaj pa nov igralec, kanadski zagon AI MyShell objavila, da je odprla svoj algoritem OpenVoice za takojšnje kloniranje glasu.

MyShell je delil posodobitev na platforma družbenih medijev X in rekel: "Klonirajte glasove z neprimerljivo natančnostjo, z natančnim nadzorom tona, od čustev do naglasa, ritma, premorov in intonacije, z uporabo samo majhnega zvočnega posnetka."

V okviru sodelovanja so raziskovalci z MIT, MyShell.ai in univerze Tsinghua predstavili OpenVoice, ki lahko posnema glas govorca in ustvari govor v več jezikov, z uporabo le kratkega zvočnega izseka iz izvirnega vira. Zajame tudi edinstven ton in barvo govorčevega glasu.

Po navedbah podjetja algoritem dodaja ključne stilske elemente, kot so čustva, naglas, ritem, premori in intonacija. Ti elementi so ključni za to, da govor zveni resnično in ustvari zanimive pogovore. Pomaga preprečiti dolgočasen zvok, ki ga pogosto dobite pri običajnem pretvorbi besedila v govor.

Kako deluje model umetne inteligence za kloniranje glasu

V raziskovalna naloga, je OpenVoice delil metodologijo za svojim AI za kloniranje glasu. OpenVoice je sestavljen iz dveh različnih AI modeli: model besedila v govor (TTS) in »pretvornik tonov«.

Model lahko upravlja slogovne parametre in jezike ter je opravil "usposabljanje z uporabo 30,000 stavkov" govorcev angleščine (z ameriškim in britanskim naglasom), kitajščine in japonščine. Usposabljanje je vključevalo označevanje vzorcev na podlagi izraženih čustev, model pa se je iz teh zvočnih posnetkov učil intonacije, ritma in pavz.

Po drugi strani je bil model pretvornika tonov usposobljen na obsežnem naboru podatkov z več kot 300,000 zvočnimi vzorci iz več kot 20,000 različnih zvočnikov. V obeh primerih je bil zvok človeškega govora pretvorjen v foneme – specifične zvoke, ki razlikujejo besede – in predstavljen z uporabo vektorskih vdelav.

Model TTS, ki uporablja "osnovni zvočnik," se združuje s tonom, ki izhaja iz uporabnikovega posnetega zvoka v procesu usposabljanja. Skupaj lahko ta dva modela ponovita uporabnikov glas in spremenita barvo tona – čustveni izraz, ki se prenaša v govorjenem besedilu.

Startup je bil ustanovljen leta 2023. Lani je MyShell zbral 5.6 milijona dolarjev začetnega financiranja, ki ga je vodil INCE Capital, med drugim pa so sodelovali ugledni vlagatelji, kot so Folius Ventures, Hashkey Capital, SevenX Ventures, TSVC in OP Crypto.

Po navedbah družbe bo financiranje pomagalo pri napredku lastništva AI modeli, ustvarjanje Creator Studia, prilagojenega za aplikacije, ki izvirajo iz umetne inteligence, in vzpostavitev živahnega ustvarjalnega ekosistema na področju tehnologije blockchain.

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Kumar je izkušen tehnični novinar, specializiran za dinamična presečišča AI/ML, marketinške tehnologije in nastajajočih področij, kot so kripto, blockchain in NFTs. Z več kot 3 leti izkušenj v panogi je Kumar pridobil dokazane rezultate pri oblikovanju privlačnih pripovedi, vodenju pronicljivih intervjujev in zagotavljanju celovitih vpogledov. Kumarjevo strokovno znanje je v izdelavi odmevnih vsebin, vključno s članki, poročili in raziskovalnimi publikacijami za pomembne industrijske platforme. Z edinstvenim naborom spretnosti, ki združuje tehnično znanje in pripovedovanje zgodb, se Kumar odlikuje pri sporočanju zapletenih tehnoloških konceptov različnim občinstvom na jasen in privlačen način.

več člankov
Kumar Gandharv
Kumar Gandharv

Kumar je izkušen tehnični novinar, specializiran za dinamična presečišča AI/ML, marketinške tehnologije in nastajajočih področij, kot so kripto, blockchain in NFTs. Z več kot 3 leti izkušenj v panogi je Kumar pridobil dokazane rezultate pri oblikovanju privlačnih pripovedi, vodenju pronicljivih intervjujev in zagotavljanju celovitih vpogledov. Kumarjevo strokovno znanje je v izdelavi odmevnih vsebin, vključno s članki, poročili in raziskovalnimi publikacijami za pomembne industrijske platforme. Z edinstvenim naborom spretnosti, ki združuje tehnično znanje in pripovedovanje zgodb, se Kumar odlikuje pri sporočanju zapletenih tehnoloških konceptov različnim občinstvom na jasen in privlačen način.

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
NuLink se zažene na Bybitu Web3 Platforma IDO. Faza naročnine se podaljša do 13. maja
Prisotnost Novice Tehnologija
NuLink se zažene na Bybitu Web3 Platforma IDO. Faza naročnine se podaljša do 13. maja
Maj 9, 2024
UXLINK in Binance sodelujeta pri novi kampanji in uporabnikom ponujata 20 milijonov točk UXUY in Airdrop Nagrade
Prisotnost Novice Tehnologija
UXLINK in Binance sodelujeta pri novi kampanji in uporabnikom ponujata 20 milijonov točk UXUY in Airdrop Nagrade
Maj 9, 2024
Side Protocol zažene Incentivized Testnet in uvede sistem notranjih točk, ki uporabnikom omogoča, da si prislužijo SIDE točke
Prisotnost Novice Tehnologija
Side Protocol zažene Incentivized Testnet in uvede sistem notranjih točk, ki uporabnikom omogoča, da si prislužijo SIDE točke
Maj 9, 2024
Web3 in kripto dogodki v maju 2024: Raziskovanje novih tehnologij in nastajajočih trendov v verigi blokov in DeFi
prebaviti ŽELITE POSTATI PARTNER Prisotnost Tehnologija
Web3 in kripto dogodki v maju 2024: Raziskovanje novih tehnologij in nastajajočih trendov v verigi blokov in DeFi
Maj 9, 2024
CRYPTOMERIA LABS PTE. LTD.