Raport aktualności Technologia
15 marca 2023 r.

Nowy model sztucznej inteligencji syntetyzuje realistyczną mowę za pomocą YouTube i podcastów

W skrócie

Naukowcy z Carnegie Mellon University stworzyli nowy model sztucznej inteligencji, który jest w stanie generować realistyczną mowę, ucząc się z filmów na YouTube i podcasty.

Model był w stanie nauczyć się niuansów naturalnych wzorców mowy, słuchając prawie 900 godzin treści z YouTube i podcastów, co zaowocowało bardziej realistycznym i realistycznym syntetycznym głosem.

Naukowcy z Carnegie Mellon University w USA stworzyłeś nowy model sztucznej inteligencji, który jest w stanie generować realistyczną mowę, ucząc się z filmów i podcastów YouTube. Model jest w stanie mówić różnymi głosami i akcentami, co czyni go potencjalnie użytecznym narzędziem w branżach takich jak rozrywka i reklama. Może to mieć również wpływ na tych, którzy komunikują się za pomocą technologii wspomagających.

Nowy model sztucznej inteligencji syntetyzuje realistyczną mowę za pomocą YouTube i podcastów
Model sztucznej inteligencji jest w stanie naśladować ludzkie wzorce mowy i intonacje z dużą dokładnością.

Jest to znaczący postęp, ponieważ stwierdzono, że większość mowy generowanej przez sztuczną inteligencję jest pozbawiona emocji i monotonna ze względu na fakt, że jest ona zwykle szkolona na zbiorach danych, w których rejestrowana jest mowa profesjonalnych aktorów. Nowa technologia może zostać wykorzystana do poprawy wydajności wirtualnych asystentów i chatbotów, czyniąc ich bardziej angażującymi i podobnymi do ludzi. Ma również potencjalne zastosowania w takich dziedzinach, jak gry, edukacja i rozrywka.

Czytaj więcej: 15 najlepszych podcastów o kryptowalutach, których musisz posłuchać w 2023 roku

Nowy model był jednak w stanie nauczyć się niuansów naturalnych wzorców mowy, takich jak pauzy, wykrzykniki i pasożytnicze słowa, słuchając prawie 900 godzin treści z YouTube i podcastów. Zaowocowało to bardziej realistycznym i realistycznym syntetycznym głosem, który został oceniony przez osoby poproszone o ocenę na 3.89 w pięciostopniowej skali. To więcej niż średni wynik uzyskiwany przez podobne modele AI (prawdziwy ludzki głos uzyskał ocenę 4.01).

Potencjalne zastosowania tej technologii są ogromne i obejmują pomoc osobom z wadami wymowy, ulepszanie systemów nawigacji i tworzenie bardziej naturalnie brzmiących wirtualnych asystentów.

  • Podcast AI to pierwszy podcast wyprodukowany przez AI, zawierający parodię Joe Rogana przeprowadzającego wywiad ze Stevem Jobsem. Ten podcast jest tworzony w całości przez algorytmy komputerowe AI. Sztuczna inteligencja została przeszkolona na potrzeby odcinka Steve'a Jobsa, korzystając zarówno z jego biografii, jak i dowolnego nagrania internetowego, które można było odkryć. To pozwoliło sztucznej inteligencji wiernie odtworzyć jego osobowość.

Przeczytaj więcej powiązanych artykułów:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Hot Stories
Dołącz do naszego newslettera.
Najnowsze wieści

Szał DOGE: analiza niedawnego wzrostu wartości Dogecoina (DOGE).

Branża kryptowalut szybko się rozwija, a monety memowe przygotowują się na znaczny wzrost. Dogecoin (DOGE), ...

Dowiedz się więcej

Ewolucja treści generowanych przez sztuczną inteligencję w Metaverse

Pojawienie się generatywnych treści AI jest jednym z najbardziej fascynujących osiągnięć w środowisku wirtualnym…

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Scroll kończy aktualizację sieci głównej Bernoulli, przewiduje 10-krotny spadek kosztów transakcji
Raport aktualności Technologia
Scroll kończy aktualizację sieci głównej Bernoulli, przewiduje 10-krotny spadek kosztów transakcji
29 kwietnia 2024 r.
OKX Jumpstart wyświetla Runecoin, umożliwia stakowanie BTC w celu zdobycia tokenów RUNE
rynki Raport aktualności Technologia
OKX Jumpstart wyświetla Runecoin, umożliwia stakowanie BTC w celu zdobycia tokenów RUNE
29 kwietnia 2024 r.
Najlepsze oferty tego tygodnia, duże inwestycje w sztuczną inteligencję, IT, Web3i Krypto (22-26.04)
Digest Biznes rynki Technologia
Najlepsze oferty tego tygodnia, duże inwestycje w sztuczną inteligencję, IT, Web3i Krypto (22-26.04)
26 kwietnia 2024 r.
Vitalik Buterin komentuje centralizację PoW, zauważa, że ​​był to etap tymczasowy do czasu PoS
Raport aktualności Technologia
Vitalik Buterin komentuje centralizację PoW, zauważa, że ​​był to etap tymczasowy do czasu PoS
26 kwietnia 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.