뉴스 보도 Technology
2023 년 3 월 15 일

새로운 AI 모델은 YouTube 및 팟캐스트를 사용하여 사실적인 음성을 합성합니다.

요컨대

카네기멜론대학교 연구진이 유튜브 영상과 영상을 통해 학습해 사실적인 음성을 생성할 수 있는 새로운 인공지능 모델을 개발했다. 팟 캐스트.

이 모델은 거의 900시간에 달하는 YouTube 및 팟캐스트 콘텐츠를 들으면서 자연스러운 발화 패턴의 뉘앙스를 학습할 수 있었으며, 그 결과 보다 사실적이고 생생한 합성 음성이 생성되었습니다.

미국 카네기멜론대학교 연구진 만들었습니다 YouTube 동영상 및 팟캐스트에서 학습하여 사실적인 음성을 생성할 수 있는 새로운 인공 지능 모델입니다. 이 모델은 다양한 목소리와 악센트로 음성을 생성할 수 있으므로 엔터테인먼트 및 광고와 같은 산업에 잠재적으로 유용한 도구가 됩니다. 또한 의사소통을 위해 보조 기술에 의존하는 사람들에게도 영향을 미칠 수 있습니다.

새로운 AI 모델은 YouTube와 팟캐스트를 사용하여 사실적인 음성을 합성하고 있습니다.
AI 모델은 사람의 음성 패턴과 억양을 매우 정확하게 모방할 수 있습니다.

AI로 생성된 음성의 대부분은 일반적으로 전문 배우의 음성이 녹음되는 데이터 세트에서 훈련된다는 사실로 인해 감정이 없고 단조로운 것으로 밝혀졌기 때문에 이는 상당한 발전입니다. 새로운 기술을 사용하여 가상 비서 및 챗봇의 성능을 향상시켜 보다 매력적이고 인간적인 모습으로 만들 수 있습니다. 또한 게임, 교육 및 엔터테인먼트와 같은 분야에서 잠재적인 응용 프로그램을 보유하고 있습니다.

더 읽기 : 15년에 들어야 할 최고의 암호화 팟캐스트 2023개

그러나 새 모델은 약 900시간 분량의 YouTube 및 팟캐스트 콘텐츠를 들으면서 멈춤, 감탄사, 기생어와 같은 자연스러운 발화 패턴의 뉘앙스를 학습할 수 있었습니다. 그 결과 보다 사실적이고 실제와 같은 합성 음성이 생성되었으며 평가 요청을 받은 사람들은 3.89점 만점에 4.01점을 받았습니다. 이는 유사한 AI 모델이 받은 평균 점수(실제 사람의 목소리가 XNUMX점)보다 높은 것입니다.

이 기술의 잠재적인 응용 분야는 방대하며 언어 장애가 있는 사람들을 돕고, 내비게이션 시스템을 개선하고, 보다 자연스럽게 들리는 가상 비서를 만드는 것을 포함합니다.

  • 팟캐스트AI AI가 제작한 최초의 팟캐스트로 Steve Jobs를 인터뷰하는 Joe Rogan의 스푸핑이 등장합니다. 이 팟캐스트는 전적으로 AI 컴퓨터 알고리즘으로 제작됩니다. AI는 스티브 잡스의 전기와 찾을 수 있는 인터넷 기록을 모두 사용하여 스티브 잡스 에피소드에 대해 훈련되었습니다. 이를 통해 AI는 자신의 성격을 충실히 재현할 수 있었습니다.

더 많은 관련 기사 읽기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

DOGE 광란: Dogecoin(DOGE)의 최근 가치 급등 분석

암호화폐 산업은 급속도로 확장되고 있으며, 밈 코인은 상당한 상승세를 준비하고 있습니다. 도지코인(DOGE), ...

현장 사진

메타버스에서 AI 생성 콘텐츠의 진화

생성적 AI 콘텐츠의 출현은 가상 환경 내에서 가장 흥미로운 발전 중 하나입니다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
스크롤, 베르누이 메인넷 업그레이드 완료, 거래 비용 10배 감소 예상
뉴스 보도 Technology
스크롤, 베르누이 메인넷 업그레이드 완료, 거래 비용 10배 감소 예상
2024 년 4 월 29 일
OKX Jumpstart, Runecoin 상장, BTC 스테이킹을 통해 RUNE 토큰 획득 가능
시장 뉴스 보도 Technology
OKX Jumpstart, Runecoin 상장, BTC 스테이킹을 통해 RUNE 토큰 획득 가능
2024 년 4 월 29 일
이번주 주요 딜, AI, IT 분야 주요 투자, Web3및 암호화폐(22-26.04)
요람 근무지에서 발생 시장 Technology
이번주 주요 딜, AI, IT 분야 주요 투자, Web3및 암호화폐(22-26.04)
2024 년 4 월 26 일
Vitalik Buterin은 PoW의 중앙화에 대해 논평하며 PoS까지는 임시 단계였다고 언급
뉴스 보도 Technology
Vitalik Buterin은 PoW의 중앙화에 대해 논평하며 PoS까지는 임시 단계였다고 언급
2024 년 4 월 26 일
CRYPTOMERIA LABS PTE. LTD.