Звіт про новини Технологія
Березня 15, 2023

Нова модель штучного інтелекту синтезує реалістичне мовлення за допомогою YouTube і подкастів

Коротко

Дослідники з Університету Карнегі-Меллона створили нову модель штучного інтелекту, яка здатна генерувати реалістичне мовлення, вивчаючи відео на YouTube і подкасти.

Модель змогла вивчити нюанси природного мовлення, прослухавши майже 900 годин YouTube і подкастів, що призвело до більш реалістичного та реалістичного синтетичного голосу.

Дослідники з Університету Карнегі-Меллона в США створили нова модель штучного інтелекту, яка здатна генерувати реалістичне мовлення, вивчаючи відео та подкасти YouTube. Модель здатна відтворювати мову різними голосами та акцентами, що робить її потенційно корисним інструментом для таких галузей, як розваги та реклама. Це також може мати наслідки для тих, хто покладається на допоміжні технології для спілкування.

Нова модель AI синтезує реалістичне мовлення за допомогою YouTube і подкастів
Модель штучного інтелекту здатна з високою точністю імітувати людську мову та інтонації.

Це важлива подія, оскільки виявилося, що більшість мовлення, створеного штучним інтелектом, є беземоційним і монотонним через те, що воно зазвичай тренується на наборах даних, де записується мовлення професійних акторів. Нову технологію можна використовувати для покращення продуктивності віртуальних помічників і чат-ботів, роблячи їх більш привабливими та схожими на людину. Він також має потенційні застосування в таких сферах, як ігри, освіта та розваги.

Детальніше: 15 найкращих криптоподкастів, які варто послухати у 2023 році

Нова модель, однак, змогла вивчити нюанси природних моделей мовлення, такі як паузи, вставні слова та слова-паразити, прослухавши майже 900 годин вмісту YouTube і подкастів. Це призвело до більш реалістичного та реалістичного синтетичного голосу, який оцінили 3.89 за п’ятибальною шкалою люди, яких попросили оцінити. Це вище, ніж середній бал, отриманий аналогічними моделями ШІ (реальний людський голос отримав 4.01).

Потенційне застосування цієї технології величезне й включає допомогу людям із вадами мовлення, покращення систем навігації та створення віртуальних помічників із більш природним звучанням.

  • PodcastAI це перший подкаст, коли-небудь створений штучним інтелектом, який показує пародію Джо Рогана, який бере інтерв’ю у Стіва Джобса. Цей подкаст створено повністю за допомогою комп’ютерних алгоритмів ШІ. Штучний інтелект був навчений для епізоду зі Стівом Джобсом, використовуючи як його біографію, так і будь-які його записи в Інтернеті, які вдалося знайти. Це дозволило ШІ достовірно відтворити його особистість.

Читайте більше пов’язаних статей:

відмова

Відповідно до Правила проекту Trust, будь ласка, зверніть увагу, що інформація, надана на цій сторінці, не призначена і не повинна тлумачитися як юридична, податкова, інвестиційна, фінансова або будь-яка інша форма консультації. Важливо інвестувати лише те, що ви можете дозволити собі втратити, і звернутися за незалежною фінансовою порадою, якщо у вас виникнуть сумніви. Щоб отримати додаткову інформацію, ми пропонуємо звернутися до положень та умов, а також до сторінок довідки та підтримки, наданих емітентом або рекламодавцем. MetaversePost прагне до точного, неупередженого звітування, але ринкові умови можуть змінюватися без попередження.

про автора

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

інші статті
Дамір Ялалов
Дамір Ялалов

Дамір є керівником групи, менеджером із продуктів і редактором Metaverse Post, що охоплює такі теми, як AI/ML, AGI, LLMs, Metaverse тощо Web3- суміжні поля. Його статті щомісяця приваблюють величезну аудиторію понад мільйон користувачів. Здається, він є експертом із 10-річним досвідом роботи в SEO та цифровому маркетингу. Даміра згадували в Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto та інші видання. Він подорожує між ОАЕ, Туреччиною, Росією та СНД як цифровий кочівник. Дамір отримав ступінь бакалавра з фізики, що, на його думку, дало йому навички критичного мислення, необхідні для досягнення успіху в Інтернеті, який постійно змінюється. 

Hot Stories
Приєднуйтеся до нашої розсилки.
Останні новини

Від Ripple до The Big Green DAO: як криптовалютні проекти сприяють благодійності

Давайте розглянемо ініціативи, які використовують потенціал цифрових валют для благодійних цілей.

Дізнайтеся більше

AlphaFold 3, Med-Gemini та інші: як AI трансформує охорону здоров’я у 2024 році

ШІ проявляється різними способами в охороні здоров’я, від виявлення нових генетичних кореляцій до розширення можливостей роботизованих хірургічних систем...

Дізнайтеся більше
Приєднуйтесь до нашої спільноти інноваційних технологій
Детальніше
Читати далі
Токенізовані RWA долають розрив між ними DeFi і TradFi
Думка Топ списки Business ринки Софтвер Технологія
Токенізовані RWA долають розрив між ними DeFi і TradFi
24 Червня, 2024.
Поточний рівень корекції біткойна все ще нижче середнього, каже криптоаналітик Rekt Capital
ринки Звіт про новини Технологія
Поточний рівень корекції біткойна все ще нижче середнього, каже криптоаналітик Rekt Capital
24 Червня, 2024.
Код індексатора протоколу SRC з відкритим вихідним кодом основних розробників, включаючи стандарти маркерів SRC-20, SRC-721 і SRC-101
Звіт про новини Софтвер Технологія
Код індексатора протоколу SRC з відкритим вихідним кодом основних розробників, включаючи стандарти маркерів SRC-20, SRC-721 і SRC-101
24 Червня, 2024.
Зліт і падіння рекламних амбіцій Oracle: мрія про 2 мільярди доларів руйнується
Думка Business Стиль життя ринки Технологія
Зліт і падіння рекламних амбіцій Oracle: мрія про 2 мільярди доларів руйнується
24 Червня, 2024.
CRYPTOMERIA LABS PTE. LTD.