ElevenLabs staje się przerażająco dobry w sztuce podszywania się pod głosy AI
W skrócie
Sieci neuronowe to przyszłość technologii, a najnowsza aktualizacja ElevenLabs Neuron pozwala mu robić coś jeszcze bardziej imponującego: podszywać się pod czyjkolwiek głos.
Syntezator został udostępniony w wersji beta pod koniec stycznia, a tydzień później Internet zalały podróbki dźwiękowe z głosami znanych osób.
ElevenLabs obiecało zająć się podróbkami i przebudować algorytm.
Niektórzy twierdzą, że sieci neuronowe to przyszłość. Mogą robić rzeczy szybciej niż ludzie, a nawet osiągać rzeczy, których ludzie nie mogą. Ale co by było, gdyby mogli zrobić coś jeszcze bardziej imponującego, na przykład podszyć się pod czyjś głos? Właśnie na to pozwala najnowsza aktualizacja ElevenLabs Neuron i jest to najfajniejsza rzecz w historii.
Polecany post: Ponad 120 najlepszych treści generowanych przez sztuczną inteligencję w 2023 r.: obrazy, muzyka, filmy |
Jeśli kiedykolwiek chciałeś brzmieć jak Tony Stark lub Steve Jobs, teraz możesz. A jeśli czujesz się wyjątkowo ambitny, możesz nawet wcielić się w Kim Kardashian. Wystarczy minutowa próbka czyjegoś głosu, a sztuczna inteligencja zajmie się resztą. Jeśli więc chcesz zaimponować swoim zaprzyjaźnij się ze swoją wyjątkową gwiazdą wrażeń lub po prostu chcesz się dobrze bawić, eksperymentując z różnymi głosami, to na pewno będzie świetne.
Oczywiście niektórzy użytkownicy wersji beta zaczynają go używać w przerażających eksperymentach. W społeczności pojawiło się kilka raportów mówiących o dość przerażających rzeczach, na przykład gdy bot został poproszony o przeczytanie fragmentu jednego z Harry Potter zamiast tego zawierał fragmenty „Mein Kampf” czytane przez gwiazdę serii o Harrym Potterze. Ale ogólnie rzecz biorąc, jest to imponujący wyczyn technologii i odtąd będzie już tylko lepiej.
Startup ElevenLabs wypuścił syntezator w wersji beta pod koniec stycznia. A tydzień później Internet został zalany podróbkami audio z głosami znanych osób: Joe Bidena, Margot Robbie, Joe Rogana, George'a Lucasa, Emmy Watson i Toma Cruise'a. Faktem jest, że do szkolenia serwisu wystarczą bardzo krótkie próbki audio lub wideo. A głosy są prawdziwe! ElevenLabs obiecało zająć się podróbkami i przebudować algorytm. |
Więc jeśli chcesz zaimponować znajomym efektownymi wrażeniami gwiazd lub po prostu chcesz się dobrze bawić, eksperymentując z różnymi głosami, Sprawdź ElevenLabs Neuron. Na pewno będzie super.
- Microsoft ogłosił w styczniu Dolina, nowy, zerowy model zamiany tekstu na mowę, który może zduplikować głos każdego. VALL-E firmy Microsoft to oparty na transformatorze model TTS, który może generować mowę dowolnym głosem po wysłuchaniu zaledwie trzysekundowej próbki. Jest to znaczna poprawa w stosunku do poprzednich modeli i może zmienić sposób, w jaki wchodzimy w interakcje z mediami cyfrowymi. Nadal brakuje kodu, ale Microsoft udostępnił przykłady działania modelu.
- Wygląda na to, że Vall-E jest najbardziej niebezpieczne oprogramowanie oszustwa kiedykolwiek wydany. Jest to głos syntetyczny, który można wykorzystać do imitowania prawdziwych ludzi i powstaje przy użyciu nagrania głosu prawdziwej osoby oraz kodu Microsoft. Najlepsze jest to, że do nauki, a dokładniej do mikronauki, potrzeba zaledwie trzech sekund mowy. Vall-E jest niebezpieczna ponieważ można go wykorzystać do nakłonienia bezbronnych osób do przesłania środków na kartę, a oszuści mogą go wykorzystać do podszywania się pod osobę znaną ofierze.
Przeczytaj więcej o sztucznej inteligencji:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.
Więcej artykułówDamir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.