ElevenLabs bliver skræmmende god til kunsten at efterligne stemmer med kunstig intelligens
Kort sagt
Neurale netværk er fremtiden for teknologi, og den seneste opdatering til ElevenLabs Neuron giver den mulighed for at gøre noget endnu mere imponerende: efterligne enhvers stemme.
Synthesizeren blev udgivet i beta i slutningen af januar, og en uge senere blev internettet oversvømmet med lydforfalskninger med berømte personers stemmer.
ElevenLabs har lovet at håndtere forfalskninger og genopbygge algoritmen.
Nogle mennesker siger, at neurale netværk er fremtiden. De kan gøre ting hurtigere end mennesker og endda opnå ting, som mennesker ikke kan. Men hvad nu hvis de kunne gøre noget endnu mere imponerende, som at efterligne nogens stemme? Det er, hvad den seneste opdatering til ElevenLabs Neuron giver den mulighed for, og det er stort set det fedeste nogensinde.
Anbefalet indlæg: Top 120+ AI-genereret indhold i 2023: Billeder, musik, videoer |
Hvis du nogensinde har ønsket at lyde som Tony Stark eller Steve Jobs, kan du nu. Eller hvis du føler dig ekstra ambitiøs, kan du endda efterligne Kim Kardashian. Alt hvad du behøver er et minut langt prøveeksemplar af en persons stemme, og AI klarer resten. Så hvis du ønsker at imponere din venner med din spot-on berømthed indtryk eller bare vil have det sjovt med at eksperimentere med forskellige stemmer, så bliver det helt sikkert et brag.
Selvfølgelig begynder nogle betabrugere at bruge det i uhyggelige eksperimenter. Der har været nogle rapporter i samfundet, der siger nogle ret uhyggelige ting, som da botten blev bedt om at læse en passage fra en af Harry Potter bøger i Emma Watsons stemme, gav den i stedet en passage af "Mein Kampf", læst af Harry Potter-franchisestjernen. Men overordnet set er det en imponerende teknologisk bedrift, og det bliver kun bedre herfra.
ElevenLabs, en startup, udgav synthesizeren til beta i slutningen af januar. Og en uge senere blev internettet oversvømmet med lydforfalskninger med stemmer fra kendte personer: Joe Biden, Margot Robbie, Joe Rogan, George Lucas, Emma Watson og Tom Cruise. Faktum er, at meget korte lyd- eller videoeksempler er nok til tjenestens træning. Og stemmerne er ægte! ElevenLabs lovede at håndtere forfalskninger og genopbygge algoritmen. |
Anbefalet indlæg: 10 bedste AI-marketingværktøjer til effektiv digital annoncering |
Så hvis du ønsker at imponere dine venner med dine spot-on berømthedsindtryk eller bare vil have det sjovt med at eksperimentere med forskellige stemmer, tjek ElevenLabs Neuron. Det bliver helt sikkert et brag.
- I januar meddelte Microsoft Vall-E, en ny zero-shot tekst-til-tale-model, der kan duplikere alles stemme. Microsofts VALL-E er en transformer-baseret TTS-model, der kan generere tale i enhver stemme efter kun at have hørt en tre-sekunders prøve. Dette er en væsentlig forbedring i forhold til tidligere modeller og har potentiale til at ændre den måde, vi interagerer med digitale medier på. Koden mangler stadig, men Microsoft har udgivet eksempler på modellen i aktion.
- Vall-E ser ud til at være det den farligste fidussoftware nogensinde udgivet. Det er en syntetisk stemme, der kan bruges til at efterligne rigtige mennesker og er lavet ved hjælp af en optagelse af en rigtig persons stemme og en Microsoft-kode. Det bedste er, at det kun kræver tre sekunders tale for at lære, eller mere præcist, for mikrolæring. Vall-E er farlig fordi det kan bruges til at narre sårbare mennesker til at overføre penge til et kort, og svindlere kan bruge det til at efterligne en, der er bekendt for offeret.
Læs mere om AI:
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.
Flere artiklerDamir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.