Nowy model sztucznej inteligencji syntetyzuje realistyczną mowę za pomocą YouTube i podcastów
W skrócie
Naukowcy z Carnegie Mellon University stworzyli nowy model sztucznej inteligencji, który jest w stanie generować realistyczną mowę, ucząc się z filmów na YouTube i podcasty.
Model był w stanie nauczyć się niuansów naturalnych wzorców mowy, słuchając prawie 900 godzin treści z YouTube i podcastów, co zaowocowało bardziej realistycznym i realistycznym syntetycznym głosem.
Naukowcy z Carnegie Mellon University w USA stworzyłeś nowy model sztucznej inteligencji, który jest w stanie generować realistyczną mowę, ucząc się z filmów i podcastów YouTube. Model jest w stanie mówić różnymi głosami i akcentami, co czyni go potencjalnie użytecznym narzędziem w branżach takich jak rozrywka i reklama. Może to mieć również wpływ na tych, którzy komunikują się za pomocą technologii wspomagających.
Jest to znaczący postęp, ponieważ stwierdzono, że większość mowy generowanej przez sztuczną inteligencję jest pozbawiona emocji i monotonna ze względu na fakt, że jest ona zwykle szkolona na zbiorach danych, w których rejestrowana jest mowa profesjonalnych aktorów. Nowa technologia może zostać wykorzystana do poprawy wydajności wirtualnych asystentów i chatbotów, czyniąc ich bardziej angażującymi i podobnymi do ludzi. Ma również potencjalne zastosowania w takich dziedzinach, jak gry, edukacja i rozrywka.
Nowy model był jednak w stanie nauczyć się niuansów naturalnych wzorców mowy, takich jak pauzy, wykrzykniki i pasożytnicze słowa, słuchając prawie 900 godzin treści z YouTube i podcastów. Zaowocowało to bardziej realistycznym i realistycznym syntetycznym głosem, który został oceniony przez osoby poproszone o ocenę na 3.89 w pięciostopniowej skali. To więcej niż średni wynik uzyskiwany przez podobne modele AI (prawdziwy ludzki głos uzyskał ocenę 4.01).
Potencjalne zastosowania tej technologii są ogromne i obejmują pomoc osobom z wadami wymowy, ulepszanie systemów nawigacji i tworzenie bardziej naturalnie brzmiących wirtualnych asystentów.
- Podcast AI to pierwszy podcast wyprodukowany przez AI, zawierający parodię Joe Rogana przeprowadzającego wywiad ze Stevem Jobsem. Ten podcast jest tworzony w całości przez algorytmy komputerowe AI. Sztuczna inteligencja została przeszkolona na potrzeby odcinka Steve'a Jobsa, korzystając zarówno z jego biografii, jak i dowolnego nagrania internetowego, które można było odkryć. To pozwoliło sztucznej inteligencji wiernie odtworzyć jego osobowość.
Przeczytaj więcej powiązanych artykułów:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.
Więcej artykułówDamir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.