รายงานข่าว เทคโนโลยี
January 31, 2023

MusicLM: โมเดล AI แปลงข้อความเป็นเพลงและรูปภาพเป็นเพลงใหม่จาก Google

ในบทสรุป

Google ขอแนะนำ MusicLM ซึ่งเป็นโมเดลสำหรับสร้างเพลงที่มีความคมชัดสูงจากคำอธิบายที่เป็นข้อความ

MusicLM สามารถกำหนดเงื่อนไขได้ทั้งข้อความและเมโลดี้ โดยสามารถเปลี่ยนท่วงทำนองผิวปากและฮัมตามสไตล์ที่อธิบายไว้ในคำอธิบายข้อความ

โมเดลก็ได้ สร้างเพลง ในหลากหลายแนวเพลง ทั้งคลาสสิก แจ๊ส และร็อค

Google ขอแนะนำ MusicLM ซึ่งเป็นแบบจำลองสำหรับสร้างเสียงดนตรีที่มีความเที่ยงตรงสูงจากคำอธิบายข้อความ เช่น "ท่วงทำนองไวโอลินที่สงบเงียบซึ่งสนับสนุนโดยริฟฟ์กีตาร์ที่บิดเบี้ยว" MusicLM ใช้กระบวนการสร้างเพลงแบบมีเงื่อนไขเป็นงานสร้างแบบจำลองลำดับชั้นต่อลำดับ และสร้างเพลงที่ 24 kHz ซึ่งคงที่ตลอดหลายนาที

MusicLM: โมเดล AI แปลงข้อความเป็นเพลงและรูปภาพเป็นเพลงใหม่จาก Google

การทดลองของ Google แสดงให้เห็นว่า MusicLM มีประสิทธิภาพดีกว่าระบบก่อนหน้า ทั้งในด้านคุณภาพเสียงและการปฏิบัติตามคำอธิบายที่เป็นข้อความ นอกจากนี้ยังแสดงให้เห็นว่า MusicLM สามารถกำหนดเงื่อนไขได้ทั้งข้อความและเมโลดี้ โดยสามารถเปลี่ยนท่วงทำนองผิวปากและฮัมตามสไตล์ที่อธิบายไว้ในคำอธิบายข้อความ เพื่อสนับสนุนการวิจัยในอนาคต เราเผยแพร่ MusicCaps สู่สาธารณะ ซึ่งเป็นชุดข้อมูลที่ประกอบด้วยคู่ข้อความดนตรี 5.5k คู่พร้อมคำอธิบาย Rich Text ที่จัดทำโดยผู้เชี่ยวชาญที่เป็นมนุษย์

บทความที่เกี่ยวข้อง: Text-to-3D: Google ได้พัฒนาโครงข่ายประสาทเทียมที่สร้างแบบจำลอง 3 มิติจากคำอธิบายข้อความ

โมเดล MusicLM ได้รับการฝึกฝนเกี่ยวกับคลังเพลงขนาดใหญ่ ซึ่งทำให้ AI สามารถเรียนรู้โครงสร้างของดนตรีได้ โมเดลก็ได้ สร้างเพลง ในหลากหลายแนวเพลง ทั้งคลาสสิก แจ๊ส และร็อค นอกจากนี้ โมเดล AI ยังสามารถสร้างองค์ประกอบใหม่ที่เป็นต้นฉบับได้อีกด้วย

โมเดล MusicLM เป็นพัฒนาการที่สำคัญในด้านดนตรีที่สร้างโดย AI โมเดลนี้แสดงถึงความก้าวหน้าที่สำคัญเหนือรุ่นก่อนๆ ซึ่งจำกัดให้ชิ้นดนตรีสั้นลงหรือสามารถสร้างเมโลดี้ง่ายๆ ได้เท่านั้น โมเดลใหม่เปิดโอกาสให้ใช้ AI เพื่อสร้างเพลงที่ยาวและซับซ้อน ซึ่งสามารถใช้ในภาพยนตร์ วิดีโอเกม หรือสื่ออื่นๆ ได้

โมเดล AI ใหม่สามารถสร้างเพลงที่มีความยาวได้ รุ่นถึงห้านาที.

บทความที่เกี่ยวข้อง: Stable Diffusion สามารถสร้างเพลงใหม่โดยสร้างสเปกตรัมตามข้อความ

โมเดล AI สามารถสร้างเพลงโดยใช้คำบรรยายจากเกมและภาพยนตร์

นอกจากนี้ โมเดล AI สามารถสร้างเพลงโดยใช้รูปภาพเป็นอินพุต

อ่านเพิ่มเติมเกี่ยวกับ AI ในอุตสาหกรรมเพลง:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

ความอยากอาหารของสถาบันเติบโตขึ้นสู่ Bitcoin ETFs ท่ามกลางความผันผวน

การเปิดเผยผ่านการยื่นเอกสาร 13F เผยให้เห็นนักลงทุนสถาบันที่มีชื่อเสียงกำลังเล่น Bitcoin ETFs ซึ่งตอกย้ำถึงการยอมรับที่เพิ่มขึ้นของ ...

รู้เพิ่มเติม

วันพิพากษามาถึง: ชะตากรรมของ CZ แขวนอยู่ในสมดุลขณะที่ศาลสหรัฐฯ พิจารณาคำร้องของ DOJ

ฉางเผิง จ้าว เตรียมเผชิญโทษจำคุกในศาลสหรัฐฯ ในเมืองซีแอตเทิลวันนี้

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
การเปลี่ยนแปลงของ Donald Trump ไปสู่ ​​Crypto: จากฝ่ายตรงข้ามไปสู่ผู้สนับสนุน และความหมายสำหรับตลาด Cryptocurrency ของสหรัฐฯ
บัญชีธุรกิจ ตลาด เรื่องราวและบทวิจารณ์ เทคโนโลยี
การเปลี่ยนแปลงของ Donald Trump ไปสู่ ​​Crypto: จากฝ่ายตรงข้ามไปสู่ผู้สนับสนุน และความหมายสำหรับตลาด Cryptocurrency ของสหรัฐฯ
May 10, 2024
Layer3 เตรียมเปิดตัวโทเค็น L3 ในฤดูร้อนนี้ โดยจัดสรร 51% ของอุปทานทั้งหมดให้กับชุมชน
ตลาด รายงานข่าว เทคโนโลยี
Layer3 เตรียมเปิดตัวโทเค็น L3 ในฤดูร้อนนี้ โดยจัดสรร 51% ของอุปทานทั้งหมดให้กับชุมชน
May 10, 2024
คำเตือนครั้งสุดท้ายของ Edward Snowden ถึงนักพัฒนา Bitcoin: “ทำให้ความเป็นส่วนตัวเป็นลำดับความสำคัญระดับโปรโตคอล ไม่เช่นนั้นความเสี่ยงที่จะสูญเสียมันไป”
ตลาด Security Wiki ซอฟต์แวร์ เรื่องราวและบทวิจารณ์ เทคโนโลยี
คำเตือนครั้งสุดท้ายของ Edward Snowden ถึงนักพัฒนา Bitcoin: “ทำให้ความเป็นส่วนตัวเป็นลำดับความสำคัญระดับโปรโตคอล ไม่เช่นนั้นความเสี่ยงที่จะสูญเสียมันไป”
May 10, 2024
Mint เครือข่าย Ethereum Layer 2 ที่ขับเคลื่อนด้วยการมองโลกในแง่ดีจะเปิดตัว Mainnet ในวันที่ 15 พฤษภาคม
รายงานข่าว เทคโนโลยี
Mint เครือข่าย Ethereum Layer 2 ที่ขับเคลื่อนด้วยการมองโลกในแง่ดีจะเปิดตัว Mainnet ในวันที่ 15 พฤษภาคม
May 10, 2024
CRYPTOMERIA LABS PTE. บจก.