새로운 AI 모델은 YouTube 및 팟캐스트를 사용하여 사실적인 음성을 합성합니다.
요컨대
카네기멜론대학교 연구진이 유튜브 영상과 영상을 통해 학습해 사실적인 음성을 생성할 수 있는 새로운 인공지능 모델을 개발했다. 팟 캐스트.
이 모델은 거의 900시간에 달하는 YouTube 및 팟캐스트 콘텐츠를 들으면서 자연스러운 발화 패턴의 뉘앙스를 학습할 수 있었으며, 그 결과 보다 사실적이고 생생한 합성 음성이 생성되었습니다.
미국 카네기멜론대학교 연구진 만들었습니다 YouTube 동영상 및 팟캐스트에서 학습하여 사실적인 음성을 생성할 수 있는 새로운 인공 지능 모델입니다. 이 모델은 다양한 목소리와 악센트로 음성을 생성할 수 있으므로 엔터테인먼트 및 광고와 같은 산업에 잠재적으로 유용한 도구가 됩니다. 또한 의사소통을 위해 보조 기술에 의존하는 사람들에게도 영향을 미칠 수 있습니다.
AI로 생성된 음성의 대부분은 일반적으로 전문 배우의 음성이 녹음되는 데이터 세트에서 훈련된다는 사실로 인해 감정이 없고 단조로운 것으로 밝혀졌기 때문에 이는 상당한 발전입니다. 새로운 기술을 사용하여 가상 비서 및 챗봇의 성능을 향상시켜 보다 매력적이고 인간적인 모습으로 만들 수 있습니다. 또한 게임, 교육 및 엔터테인먼트와 같은 분야에서 잠재적인 응용 프로그램을 보유하고 있습니다.
그러나 새 모델은 약 900시간 분량의 YouTube 및 팟캐스트 콘텐츠를 들으면서 멈춤, 감탄사, 기생어와 같은 자연스러운 발화 패턴의 뉘앙스를 학습할 수 있었습니다. 그 결과 보다 사실적이고 실제와 같은 합성 음성이 생성되었으며 평가 요청을 받은 사람들은 3.89점 만점에 4.01점을 받았습니다. 이는 유사한 AI 모델이 받은 평균 점수(실제 사람의 목소리가 XNUMX점)보다 높은 것입니다.
이 기술의 잠재적인 응용 분야는 방대하며 언어 장애가 있는 사람들을 돕고, 내비게이션 시스템을 개선하고, 보다 자연스럽게 들리는 가상 비서를 만드는 것을 포함합니다.
- 팟캐스트AI AI가 제작한 최초의 팟캐스트로 Steve Jobs를 인터뷰하는 Joe Rogan의 스푸핑이 등장합니다. 이 팟캐스트는 전적으로 AI 컴퓨터 알고리즘으로 제작됩니다. AI는 스티브 잡스의 전기와 찾을 수 있는 인터넷 기록을 모두 사용하여 스티브 잡스 에피소드에 대해 훈련되었습니다. 이를 통해 AI는 자신의 성격을 충실히 재현할 수 있었습니다.
더 많은 관련 기사 읽기:
책임 부인
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.
더 많은 기사Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.