뉴스 보도 Technology
2023 년 1 월 31 일

MusicLM: Google의 새로운 텍스트-음악 및 이미지-음악 AI 모델

요컨대

Google은 텍스트 설명에서 고품질 음악을 생성하는 모델인 MusicLM을 도입합니다.

MusicLM은 텍스트 캡션에 설명된 스타일에 따라 휘파람을 불고 흥얼거리는 멜로디를 변형할 수 있다는 점에서 텍스트와 멜로디 모두에 조건을 지정할 수 있습니다.

모델은 할 수 있습니다 음악 생성 클래식, 재즈, 록 등 다양한 장르의 곡을 선보입니다.

Google은 "왜곡된 기타 리프로 뒷받침되는 차분한 바이올린 멜로디"와 같은 텍스트 설명에서 충실도가 높은 음악을 생성하는 모델인 MusicLM을 소개합니다. MusicLM은 조건부 음악 생성 프로세스를 계층적 시퀀스 간 모델링 작업으로 캐스팅하고 몇 분 동안 일관되게 유지되는 24kHz에서 음악을 생성합니다.

MusicLM: Google의 새로운 텍스트-음악 및 이미지-음악 AI 모델

Google 실험에 따르면 MusicLM은 오디오 품질과 텍스트 설명 준수 모두에서 이전 시스템보다 우수한 것으로 나타났습니다. 또한 텍스트 캡션에 설명된 스타일에 따라 휘파람을 불고 흥얼거리는 멜로디를 변형할 수 있다는 점에서 MusicLM이 텍스트와 멜로디 모두에 조건화될 수 있음을 보여줍니다. 향후 연구를 지원하기 위해 전문가가 제공한 풍부한 텍스트 설명이 포함된 5.5k 음악 텍스트 쌍으로 구성된 데이터 세트인 MusicCaps를 공개적으로 출시합니다.

관련 기사 : Text-to-3D: Google은 텍스트 설명에서 3D 모델을 생성하는 신경망을 개발했습니다.

MusicLM 모델은 AI가 음악의 구조를 학습할 수 있는 대규모 악보 모음에 대해 훈련되었습니다. 모델은 할 수 있습니다 음악 생성 클래식, 재즈, 록 등 다양한 장르의 곡을 선보입니다. 또한 AI 모델은 새롭고 독창적인 구성을 만들 수 있습니다.

MusicLM 모델은 AI 생성 음악 분야에서 중요한 발전입니다. 이 모델은 짧은 음악으로 제한되거나 단순한 멜로디만 생성할 수 있었던 이전 모델에 비해 상당한 발전을 나타냅니다. 새로운 모델은 AI를 사용하여 영화, 비디오 게임 또는 기타 미디어에서 사용할 수 있는 길고 복잡한 음악을 생성할 수 있는 가능성을 열어줍니다.

새로운 AI 모델은 긴 음악을 생성할 수 있습니다. 최대 XNUMX분의 세대.

관련 기사 : Stable Diffusion 텍스트를 기반으로 스펙트로그램을 생성하여 새로운 음악을 만들 수 있습니다.

AI 모델은 게임과 영화의 자막을 사용하여 음악을 만들 수 있습니다.

또한 AI 모델은 이미지를 입력으로 사용하여 음악을 생성할 수 있습니다.

음악 산업의 AI에 대해 자세히 알아보기:

책임 부인

줄 안 트러스트 프로젝트 지침, 이 페이지에 제공된 정보는 법률, 세금, 투자, 재정 또는 기타 형태의 조언을 제공하기 위한 것이 아니며 해석되어서도 안 됩니다. 손실을 감수할 수 있는 만큼만 투자하고 의심스러운 경우 독립적인 재정 조언을 구하는 것이 중요합니다. 자세한 내용은 이용약관은 물론 발행자나 광고주가 제공하는 도움말 및 지원 페이지를 참조하시기 바랍니다. MetaversePost 는 정확하고 편견 없는 보고를 위해 최선을 다하고 있지만 시장 상황은 예고 없이 변경될 수 있습니다.

저자에 관하여

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

더 많은 기사
다미르 얄랄로프
다미르 얄랄로프

Damir는 팀 리더, 제품 관리자 및 편집자입니다. Metaverse Post, AI/ML, AGI, LLM, Metaverse 및 Web3-관련 분야. 그의 기사는 매달 백만 명이 넘는 사용자의 엄청난 청중을 끌어들입니다. 그는 SEO 및 디지털 마케팅 분야에서 10년의 경험을 가진 전문가로 보입니다. Damir는 Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto 및 기타 간행물. UAE, 터키, 러시아, CIS를 오가며 디지털 유목민으로 활동하고 있습니다. Damir는 끊임없이 변화하는 인터넷 환경에서 성공하는 데 필요한 비판적 사고 기술을 제공했다고 믿는 물리학 학사 학위를 받았습니다. 

Hot Stories
뉴스레터에 가입하세요.
최신 뉴스

변동성 속에서 비트코인 ​​ETF를 향한 기관의 선호도 증가

13F 서류를 통한 공개를 통해 주목할만한 기관 투자자들이 비트코인 ​​ETF에 손을 대고 있음이 드러났으며, 이는 비트코인 ​​ETF에 대한 수용이 증가하고 있음을 강조합니다.

현장 사진

선고일이 다가왔습니다: 미국 법원이 DOJ의 주장을 고려함에 따라 CZ의 운명이 균형을 이루고 있습니다.

자오창펑(Changpeng Zhao)은 오늘 시애틀의 미국 법원에서 선고를 받을 예정이다.

현장 사진
혁신적인 기술 커뮤니티에 참여하세요
상세 보기
자세히 보기
Espresso Systems, 롤업 상호 운용성 향상을 위해 AggLayer 개발을 위해 Polygon Lab과 협력
근무지에서 발생 뉴스 보도 Technology
Espresso Systems, 롤업 상호 운용성 향상을 위해 AggLayer 개발을 위해 Polygon Lab과 협력
2024 년 5 월 9 일
ZKP 기반 인프라 프로토콜 ZKBase, 로드맵 공개, 5월 테스트넷 출시 계획
뉴스 보도 Technology
ZKP 기반 인프라 프로토콜 ZKBase, 로드맵 공개, 5월 테스트넷 출시 계획
2024 년 5 월 9 일
BLOCKCHANCE와 CONF3RENCE가 독일 최대 규모를 위해 통합되었습니다. Web3 도르트문트 회의
근무지에서 발생 시장 소프트웨어 이야기와 리뷰 Technology
BLOCKCHANCE와 CONF3RENCE가 독일 최대 규모를 위해 통합되었습니다. Web3 도르트문트 회의
2024 년 5 월 9 일
NuLink가 Bybit에서 출시되었습니다 Web3 IDO 플랫폼. 구독 기간이 13월 XNUMX일까지 연장됩니다
시장 뉴스 보도 Technology
NuLink가 Bybit에서 출시되었습니다 Web3 IDO 플랫폼. 구독 기간이 13월 XNUMX일까지 연장됩니다
2024 년 5 월 9 일
CRYPTOMERIA LABS PTE. LTD.