Нов AI модел синтезира реалистична реч с помощта на YouTube и подкасти
Накратко
Изследователи от университета Карнеги Мелън създадоха нов модел на изкуствен интелект, който е в състояние да генерира реалистична реч, като се учи от видеоклипове в YouTube и подкасти.
Моделът успя да научи нюансите на естествените говорни модели чрез слушане на почти 900 часа YouTube и подкаст съдържание, което доведе до по-реалистичен и реалистичен синтетичен глас.
Изследователи от университета Карнеги Мелън в САЩ са създали нов модел на изкуствен интелект, който е в състояние да генерира реалистична реч, като се учи от видеоклипове и подкасти в YouTube. Моделът е способен да произвежда реч с различни гласове и акценти, което го прави потенциално полезен инструмент за индустрии като развлечения и реклама. Това може да има последици и за тези, които разчитат на помощни технологии за комуникация.
Това е значително развитие, тъй като беше установено, че по-голямата част от генерираната от AI реч е лишена от емоции и монотонна поради факта, че обикновено се обучава върху масиви от данни, където се записва речта на професионални актьори. Новата технология може да се използва за подобряване на работата на виртуални асистенти и чатботове, правейки ги по-ангажиращи и подобни на хората. Освен това има потенциални приложения в области като игри, образование и развлечения.
Новият модел обаче успя да научи нюансите на естествените говорни модели, като паузи, междуметия и паразитни думи, като слушаше почти 900 часа YouTube и подкаст съдържание. Това доведе до по-реалистичен и реалистичен синтетичен глас, който беше оценен с 3.89 по петобална скала от хората, които бяха помолени да го оценят. Това е по-високо от средния резултат, получен от подобни AI модели (истински човешки глас отбеляза 4.01).
Потенциалните приложения на тази технология са обширни и включват подпомагане на хора с говорни увреждания, подобряване на навигационните системи и създаване на по-естествено звучащи виртуални асистенти.
- PodcastAI е първият подкаст, създаван някога от AI, включващ пародия на Джо Роугън, интервюиращ Стив Джобс. Този подкаст е направен изцяло от AI компютърни алгоритми. AI беше обучен за епизода със Стив Джобс, използвайки както неговата биография, така и всеки негов запис в интернет, който можеше да открие. Това позволи на AI да пресъздаде вярно неговата личност.
Прочетете още свързани статии:
Отказ от отговорност
В съответствие с Доверете се насоките на проекта, моля, имайте предвид, че предоставената на тази страница информация не е предназначена да бъде и не трябва да се тълкува като правен, данъчен, инвестиционен, финансов или каквато и да е друга форма на съвет. Важно е да инвестирате само това, което можете да си позволите да загубите, и да потърсите независим финансов съвет, ако имате някакви съмнения. За допълнителна информация предлагаме да се обърнете към правилата и условията, както и към страниците за помощ и поддръжка, предоставени от издателя или рекламодателя. MetaversePost се ангажира с точно, безпристрастно отчитане, но пазарните условия подлежат на промяна без предизвестие.
За автора
Дамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.
Още статииДамир е ръководител на екип, продуктов мениджър и редактор в Metaverse Post, обхващащи теми като AI/ML, AGI, LLMs, Metaverse и Web3- свързани полета. Статиите му привличат огромна аудитория от над милион потребители всеки месец. Изглежда, че е експерт с 10 години опит в SEO и дигитален маркетинг. Дамир е споменат в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto и други публикации. Той пътува между ОАЕ, Турция, Русия и ОНД като дигитален номад. Дамир получава бакалавърска степен по физика, която според него му е дала уменията за критично мислене, необходими за успех в непрекъснато променящия се пейзаж на интернет.