Новини Технологии
Март 15, 2023

Нов AI модел синтезира реалистична реч с помощта на YouTube и подкасти

Накратко

Изследователи от университета Карнеги Мелън създадоха нов модел на изкуствен интелект, който е в състояние да генерира реалистична реч, като се учи от видеоклипове в YouTube и подкасти.

Моделът успя да научи нюансите на естествените говорни модели чрез слушане на почти 900 часа YouTube и подкаст съдържание, което доведе до по-реалистичен и реалистичен синтетичен глас.

Изследователи от университета Карнеги Мелън в САЩ са създали нов модел на изкуствен интелект, който е в състояние да генерира реалистична реч, като се учи от видеоклипове и подкасти в YouTube. Моделът е способен да произвежда реч с различни гласове и акценти, което го прави потенциално полезен инструмент за индустрии като развлечения и реклама. Това може да има последици и за тези, които разчитат на помощни технологии за комуникация.

Нов AI модел синтезира реалистична реч с помощта на YouTube и подкасти
Моделът с изкуствен интелект е способен да имитира човешки говорни модели и интонации с висока точност.

Това е значително развитие, тъй като беше установено, че по-голямата част от генерираната от AI реч е лишена от емоции и монотонна поради факта, че обикновено се обучава върху масиви от данни, където се записва речта на професионални актьори. Новата технология може да се използва за подобряване на работата на виртуални асистенти и чатботове, правейки ги по-ангажиращи и подобни на хората. Освен това има потенциални приложения в области като игри, образование и развлечения.

Чети повече: 15 най-добри крипто подкаста, които трябва да слушате през 2023 г

Новият модел обаче успя да научи нюансите на естествените говорни модели, като паузи, междуметия и паразитни думи, като слушаше почти 900 часа YouTube и подкаст съдържание. Това доведе до по-реалистичен и реалистичен синтетичен глас, който беше оценен с 3.89 по петобална скала от хората, които бяха помолени да го оценят. Това е по-високо от средния резултат, получен от подобни AI модели (истински човешки глас отбеляза 4.01).

Потенциалните приложения на тази технология са обширни и включват подпомагане на хора с говорни увреждания, подобряване на навигационните системи и създаване на по-естествено звучащи виртуални асистенти.

  • PodcastAI е първият подкаст, създаван някога от AI, включващ пародия на Джо Роугън, интервюиращ Стив Джобс. Този подкаст е направен изцяло от AI компютърни алгоритми. AI беше обучен за епизода със Стив Джобс, използвайки както неговата биография, така и всеки негов запис в интернет, който можеше да открие. Това позволи на AI да пресъздаде вярно неговата личност.

Прочетете още свързани статии:

Отказ от отговорност

В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.

За автора

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Още статии
Дамир Ялалов
Дамир Ялалов

Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет. 

Hot Stories
Присъединете се към нашия бюлетин.
Последни новини

The DOGE Frenzy: Анализ на скорошния скок на стойността на Dogecoin (DOGE)

Индустрията на криптовалутите се разраства бързо и мем монетите се подготвят за значителен подем. Доджкойн (DOGE), ...

Научете още

Еволюцията на генерираното от изкуствен интелект съдържание в метавселената

Появата на генеративно AI съдържание е едно от най-завладяващите развития във виртуалната среда...

Научете още
Присъединете се към нашата иновативна техническа общност
Вижте повече
Прочети повече
Scroll завършва надграждането на Bernoulli Mainnet, предвижда 10 пъти намаление на транзакционните разходи
Новини Технологии
Scroll завършва надграждането на Bernoulli Mainnet, предвижда 10 пъти намаление на транзакционните разходи
Април 29, 2024
OKX Jumpstart изброява Runecoin, позволява залагане на BTC за печелене на RUNE токени
пазари Новини Технологии
OKX Jumpstart изброява Runecoin, позволява залагане на BTC за печелене на RUNE токени
Април 29, 2024
Най-добрите оферти за тази седмица, големи инвестиции в AI, IT, Web3и крипто (22-26.04)
резюме Бизнес пазари Технологии
Най-добрите оферти за тази седмица, големи инвестиции в AI, IT, Web3и крипто (22-26.04)
Април 26, 2024
Виталик Бутерин коментира централизацията на PoW, отбелязва, че това е временен етап до PoS
Новини Технологии
Виталик Бутерин коментира централизацията на PoW, отбелязва, че това е временен етап до PoS
Април 26, 2024
CRYPTOMERIA LABS PTE. LTD.