뉴스 보도 Technology
2023 년 1 월 31 일

MusicLM: Google의 새로운 텍스트-음악 및 이미지-음악 AI 모델

요컨대

Google은 텍스트 설명에서 고품질 음악을 생성하는 모델인 MusicLM을 도입합니다.

MusicLM은 텍스트 캡션에 설명된 스타일에 따라 휘파람을 불고 흥얼거리는 멜로디를 변형할 수 있다는 점에서 텍스트와 멜로디 모두에 조건을 지정할 수 있습니다.

모델은 할 수 있습니다 음악 생성 클래식, 재즈, 록 등 다양한 장르의 곡을 선보입니다.

Google은 "왜곡된 기타 리프로 뒷받침되는 차분한 바이올린 멜로디"와 같은 텍스트 설명에서 충실도가 높은 음악을 생성하는 모델인 MusicLM을 소개합니다. MusicLM은 조건부 음악 생성 프로세스를 계층적 시퀀스 간 모델링 작업으로 캐스팅하고 몇 분 동안 일관되게 유지되는 24kHz에서 음악을 생성합니다.

MusicLM: Google의 새로운 텍스트-음악 및 이미지-음악 AI 모델

Google 실험에 따르면 MusicLM은 오디오 품질과 텍스트 설명 준수 모두에서 이전 시스템보다 우수한 것으로 나타났습니다. 또한 텍스트 캡션에 설명된 스타일에 따라 휘파람을 불고 흥얼거리는 멜로디를 변형할 수 있다는 점에서 MusicLM이 텍스트와 멜로디 모두에 조건화될 수 있음을 보여줍니다. 향후 연구를 지원하기 위해 전문가가 제공한 풍부한 텍스트 설명이 포함된 5.5k 음악 텍스트 쌍으로 구성된 데이터 세트인 MusicCaps를 공개적으로 출시합니다.

관련 기사 : Text-to-3D: Google은 텍스트 설명에서 3D 모델을 생성하는 신경망을 개발했습니다.

MusicLM 모델은 AI가 음악의 구조를 학습할 수 있는 대규모 악보 모음에 대해 훈련되었습니다. 모델은 할 수 있습니다 음악 생성 클래식, 재즈, 록 등 다양한 장르의 곡을 선보입니다. 또한 AI 모델은 새롭고 독창적인 구성을 만들 수 있습니다.

MusicLM 모델은 AI 생성 음악 분야에서 중요한 발전입니다. 이 모델은 짧은 음악으로 제한되거나 단순한 멜로디만 생성할 수 있었던 이전 모델에 비해 상당한 발전을 나타냅니다. 새로운 모델은 AI를 사용하여 영화, 비디오 게임 또는 기타 미디어에서 사용할 수 있는 길고 복잡한 음악을 생성할 수 있는 가능성을 열어줍니다.

새로운 AI 모델은 긴 음악을 생성할 수 있습니다. 최대 XNUMX분의 세대.

관련 기사 : Stable Diffusion 텍스트를 기반으로 스펙트로그램을 생성하여 새로운 음악을 만들 수 있습니다.

AI 모델은 게임과 영화의 자막을 사용하여 음악을 만들 수 있습니다.

또한 AI 모델은 이미지를 입력으로 사용하여 음악을 생성할 수 있습니다.

음악 산업의 AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

DOGE 광란: Dogecoin(DOGE)의 최근 가치 급등 분석

암호화폐 산업은 급속도로 확장되고 있으며, 밈 코인은 상당한 상승세를 준비하고 있습니다. 도지코인(DOGE), ...

현장 사진

메타버스에서 AI 생성 콘텐츠의 진화

생성적 AI 콘텐츠의 출현은 가상 환경 내에서 가장 흥미로운 발전 중 하나입니다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
이번주 주요 딜, AI, IT 분야 주요 투자, Web3및 암호화폐(22-26.04)
요람 근무지에서 발생 시장 Technology
이번주 주요 딜, AI, IT 분야 주요 투자, Web3및 암호화폐(22-26.04)
2024 년 4 월 26 일
Vitalik Buterin은 PoW의 중앙화에 대해 논평하며 PoS까지는 임시 단계였다고 언급
뉴스 보도 Technology
Vitalik Buterin은 PoW의 중앙화에 대해 논평하며 PoS까지는 임시 단계였다고 언급
2024 년 4 월 26 일
Offchain Labs는 Optimism의 OP 스택 사기 증명에서 두 가지 중요한 취약점을 발견했습니다.
뉴스 보도 소프트웨어 Technology
Offchain Labs는 Optimism의 OP 스택 사기 증명에서 두 가지 중요한 취약점을 발견했습니다.
2024 년 4 월 26 일
RollApps의 유동성 연결을 위한 Dymension의 공개 시장 eIBC, 메인넷 출시
뉴스 보도 Technology
RollApps의 유동성 연결을 위한 Dymension의 공개 시장 eIBC, 메인넷 출시 
2024 년 4 월 26 일
CRYPTOMERIA LABS PTE. LTD.