SingSong: Google AI 연구원들이 입력 보컬에 반주하는 음악을 생성하는 방법을 찾습니다.
요컨대
SingSong이라는 새로운 시스템은 심층적인 학습 모델 기존 시스템보다 노래와 더 잘 어울리는 음악을 생성합니다.
연구자들은 이 시스템을 사용하여 전문 가수를 위한 노래방 트랙을 만들거나 아마추어 가수가 자신의 목소리에 맞는 반주를 찾도록 도울 수 있다고 말합니다.
Google의 연구원은 인공 지능을 사용하여 노래와 호환되는 음악을 생성하는 방법을 찾았습니다. SingSong이라는 새로운 시스템은 딥 러닝 모델을 사용하여 다른 기존 시스템보다 노래와 더 일치하는 반주를 생성합니다. 연구원들은 이 시스템을 사용하여 전문 가수를 위한 노래방 트랙을 만들거나 아마추어 가수가 자신의 목소리에 더 잘 맞는 반주를 찾도록 도울 수 있다고 말합니다.
노래 입력 보컬에 반주하는 기악을 생성하는 Google에서 개발한 시스템입니다. 그것은 음악가와 비음악가 모두에게 자신의 목소리를 특징으로 하는 음악을 만드는 단순하고 새로운 접근 방식을 제공할 수 있습니다. 개발자는 이를 달성하기 위해 음악 소스 분리 및 오디오 제작의 최근 발전을 기반으로 합니다. 개발자는 특히 최첨단 소스 분리 방법을 사용하여 대규모 음악 녹음 모음에서 정렬된 보컬 및 악기 소스 쌍을 구축합니다. 그런 다음 개발자가 수정합니다. 오디오LM, 조건부 "오디오 대 오디오" 생성 작업을 위해 소스가 분리된(보컬, 악기) 쌍에 대해 훈련될 수 있도록 조건부 오디오 제작을 위한 최첨단 방법입니다.
AI 연구원은 보컬 입력의 다양한 기능화를 조사합니다. 이 기능 중 가장 좋은 기능은 소스 분리된 교육 데이터(보컬에 인공 음성이 포함된 경우)에서 시스템의 일반화를 개선하기 위해 기본 AudioLM 기능화에 비해 격리된 보컬의 정량적 성능을 53% 향상시킵니다. instrumental)을 개발자가 사용자에게 기대할 수 있는 고립된 보컬로 변경합니다. 청취자들은 동일한 음성 입력과의 쌍별 비교에서 강력한 검색 기준선보다 SingSong이 생성한 악기에 대해 상당한 선호도를 보였습니다.
대조적으로 새로운 시스템은 딥 러닝 모델 대규모 음악 데이터 세트에서 훈련되었습니다. 이를 통해 시스템은 가수의 음성 및 타이밍과 동기화된 반주를 생성할 수 있습니다.
연구를 위해 청취자에게는 음성(MUSDB10 테스트에서 가져온)은 동일하지만 악기는 다르며 다양한 소스(실측 실제, 구글 모델또는 기준선). 질문은 청취자들에게 두 가지 조합 중 악기 반주가 보컬에 음악적으로 더 적합하다고 생각하는 조합을 선택하도록 요청합니다.
SingSong의 신선한 사례
일련의 심층 신경망을 사용하여 생성 모델, 개발자는 더 긴 세그먼트에 대해 대기 시간 없이 화성 반주를 생성할 수 있습니다.
앞의 예에서는 MUSDB18 데이터 세트의 전문 음성이 사용되었습니다. 또한 누구나 자신의 목소리로 음악을 만들 수 있도록 지원하고 가능하게 하는 SingSong의 능력에 흥미를 느낍니다. 여기에서는 소비자 가전에서 만든 아마추어 보컬리스트의 녹음을 포함하는 Vocadito 데이터 세트의 보컬 샘플을 사용하여 이를 검사합니다.
이 시스템은 아직 개발 초기 단계에 있습니다. 연구자들은 상업적으로 사용되기 전에 개선이 필요하다고 말하지만 노래방 산업에 혁명을 일으키고 아마추어 가수들이 그들에게 잘 맞는 반주를 찾도록 도울 잠재력이 있다고 믿고 있습니다.
더 많은 관련 기사 읽기:
책임 부인
줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.
저자에 관하여
Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.
더 많은 기사Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다.