รายงานข่าว เทคโนโลยี
January 31, 2023

MusicLM: โมเดล AI แปลงข้อความเป็นเพลงและรูปภาพเป็นเพลงใหม่จาก Google

ในบทสรุป

Google ขอแนะนำ MusicLM ซึ่งเป็นโมเดลสำหรับสร้างเพลงที่มีความคมชัดสูงจากคำอธิบายที่เป็นข้อความ

MusicLM สามารถกำหนดเงื่อนไขได้ทั้งข้อความและเมโลดี้ โดยสามารถเปลี่ยนท่วงทำนองผิวปากและฮัมตามสไตล์ที่อธิบายไว้ในคำอธิบายข้อความ

โมเดลก็ได้ สร้างเพลง ในหลากหลายแนวเพลง ทั้งคลาสสิก แจ๊ส และร็อค

Google ขอแนะนำ MusicLM ซึ่งเป็นแบบจำลองสำหรับสร้างเสียงดนตรีที่มีความเที่ยงตรงสูงจากคำอธิบายข้อความ เช่น "ท่วงทำนองไวโอลินที่สงบเงียบซึ่งสนับสนุนโดยริฟฟ์กีตาร์ที่บิดเบี้ยว" MusicLM ใช้กระบวนการสร้างเพลงแบบมีเงื่อนไขเป็นงานสร้างแบบจำลองลำดับชั้นต่อลำดับ และสร้างเพลงที่ 24 kHz ซึ่งคงที่ตลอดหลายนาที

MusicLM: โมเดล AI แปลงข้อความเป็นเพลงและรูปภาพเป็นเพลงใหม่จาก Google

การทดลองของ Google แสดงให้เห็นว่า MusicLM มีประสิทธิภาพดีกว่าระบบก่อนหน้า ทั้งในด้านคุณภาพเสียงและการปฏิบัติตามคำอธิบายที่เป็นข้อความ นอกจากนี้ยังแสดงให้เห็นว่า MusicLM สามารถกำหนดเงื่อนไขได้ทั้งข้อความและเมโลดี้ โดยสามารถเปลี่ยนท่วงทำนองผิวปากและฮัมตามสไตล์ที่อธิบายไว้ในคำอธิบายข้อความ เพื่อสนับสนุนการวิจัยในอนาคต เราเผยแพร่ MusicCaps สู่สาธารณะ ซึ่งเป็นชุดข้อมูลที่ประกอบด้วยคู่ข้อความดนตรี 5.5k คู่พร้อมคำอธิบาย Rich Text ที่จัดทำโดยผู้เชี่ยวชาญที่เป็นมนุษย์

บทความที่เกี่ยวข้อง: Text-to-3D: Google ได้พัฒนาโครงข่ายประสาทเทียมที่สร้างแบบจำลอง 3 มิติจากคำอธิบายข้อความ

โมเดล MusicLM ได้รับการฝึกฝนเกี่ยวกับคลังเพลงขนาดใหญ่ ซึ่งทำให้ AI สามารถเรียนรู้โครงสร้างของดนตรีได้ โมเดลก็ได้ สร้างเพลง ในหลากหลายแนวเพลง ทั้งคลาสสิก แจ๊ส และร็อค นอกจากนี้ โมเดล AI ยังสามารถสร้างองค์ประกอบใหม่ที่เป็นต้นฉบับได้อีกด้วย

โมเดล MusicLM เป็นพัฒนาการที่สำคัญในด้านดนตรีที่สร้างโดย AI โมเดลนี้แสดงถึงความก้าวหน้าที่สำคัญเหนือรุ่นก่อนๆ ซึ่งจำกัดให้ชิ้นดนตรีสั้นลงหรือสามารถสร้างเมโลดี้ง่ายๆ ได้เท่านั้น โมเดลใหม่เปิดโอกาสให้ใช้ AI เพื่อสร้างเพลงที่ยาวและซับซ้อน ซึ่งสามารถใช้ในภาพยนตร์ วิดีโอเกม หรือสื่ออื่นๆ ได้

โมเดล AI ใหม่สามารถสร้างเพลงที่มีความยาวได้ รุ่นถึงห้านาที.

บทความที่เกี่ยวข้อง: Stable Diffusion สามารถสร้างเพลงใหม่โดยสร้างสเปกตรัมตามข้อความ

โมเดล AI สามารถสร้างเพลงโดยใช้คำบรรยายจากเกมและภาพยนตร์

นอกจากนี้ โมเดล AI สามารถสร้างเพลงโดยใช้รูปภาพเป็นอินพุต

อ่านเพิ่มเติมเกี่ยวกับ AI ในอุตสาหกรรมเพลง:

ข้อจำกัดความรับผิดชอบ

สอดคล้องกับ แนวทางโครงการที่เชื่อถือได้โปรดทราบว่าข้อมูลที่ให้ไว้ในหน้านี้ไม่ได้มีจุดมุ่งหมายและไม่ควรตีความว่าเป็นคำแนะนำทางกฎหมาย ภาษี การลงทุน การเงิน หรือรูปแบบอื่นใด สิ่งสำคัญคือต้องลงทุนเฉพาะในสิ่งที่คุณสามารถที่จะสูญเสียได้ และขอคำแนะนำทางการเงินที่เป็นอิสระหากคุณมีข้อสงสัยใดๆ สำหรับข้อมูลเพิ่มเติม เราขอแนะนำให้อ้างอิงข้อกำหนดและเงื่อนไขตลอดจนหน้าช่วยเหลือและสนับสนุนที่ผู้ออกหรือผู้ลงโฆษณาให้ไว้ MetaversePost มุ่งมั่นที่จะรายงานที่ถูกต้องและเป็นกลาง แต่สภาวะตลาดอาจมีการเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า

เกี่ยวกับผู้เขียน

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

บทความอื่น ๆ
ดาเมียร์ ยาลอฟ
ดาเมียร์ ยาลอฟ

Damir เป็นหัวหน้าทีม ผู้จัดการผลิตภัณฑ์ และบรรณาธิการที่ Metaverse Postซึ่งครอบคลุมหัวข้อต่างๆ เช่น AI/ML, AGI, LLMs, Metaverse และ Web3- สาขาที่เกี่ยวข้อง บทความของเขาดึงดูดผู้ชมจำนวนมากกว่าล้านคนทุกเดือน ดูเหมือนว่าเขาจะเป็นผู้เชี่ยวชาญที่มีประสบการณ์ 10 ปีในด้าน SEO และการตลาดดิจิทัล Damir ได้รับการกล่าวถึงใน Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto และสิ่งพิมพ์อื่น ๆ เขาเดินทางไปมาระหว่างสหรัฐอาหรับเอมิเรตส์ ตุรกี รัสเซีย และ CIS ในฐานะคนเร่ร่อนทางดิจิทัล Damir สำเร็จการศึกษาระดับปริญญาตรีสาขาฟิสิกส์ ซึ่งเขาเชื่อว่าทำให้เขามีทักษะการคิดเชิงวิพากษ์ที่จำเป็นต่อการประสบความสำเร็จในภูมิทัศน์ที่เปลี่ยนแปลงตลอดเวลาของอินเทอร์เน็ต 

Hot Stories
เข้าร่วมจดหมายข่าวของเรา
ข่าวล่าสุด

DOGE Frenzy: การวิเคราะห์มูลค่าที่เพิ่มขึ้นล่าสุดของ Dogecoin (DOGE)

อุตสาหกรรมสกุลเงินดิจิทัลกำลังขยายตัวอย่างรวดเร็ว และเหรียญมีมกำลังเตรียมพร้อมสำหรับการแกว่งตัวขึ้นอย่างมีนัยสำคัญ โดชคอยน์ (DOGE), ...

รู้เพิ่มเติม

วิวัฒนาการของเนื้อหาที่สร้างโดย AI ใน Metaverse

การเกิดขึ้นของเนื้อหา AI เจนเนอเรชั่นถือเป็นหนึ่งในพัฒนาการที่น่าสนใจที่สุดภายในสภาพแวดล้อมเสมือนจริง ...

รู้เพิ่มเติม
เข้าร่วมชุมชนเทคโนโลยีที่เป็นนวัตกรรมของเรา
อ่านเพิ่มเติม
อ่านเพิ่มเติม
ข้อเสนอที่ดีที่สุดประจำสัปดาห์นี้ การลงทุนที่สำคัญใน AI, ไอที Web3และสกุลเงินดิจิทัล (22-26.04)
ย่อยอาหาร บัญชีธุรกิจ ตลาด เทคโนโลยี
ข้อเสนอที่ดีที่สุดประจำสัปดาห์นี้ การลงทุนที่สำคัญใน AI, ไอที Web3และสกุลเงินดิจิทัล (22-26.04)
April 26, 2024
Vitalik Buterin แสดงความคิดเห็นเกี่ยวกับการรวมศูนย์ของ PoW โปรดทราบว่านี่เป็นขั้นตอนชั่วคราวจนกว่าจะถึง PoS
รายงานข่าว เทคโนโลยี
Vitalik Buterin แสดงความคิดเห็นเกี่ยวกับการรวมศูนย์ของ PoW โปรดทราบว่านี่เป็นขั้นตอนชั่วคราวจนกว่าจะถึง PoS
April 26, 2024
Offchain Labs เผยการค้นพบช่องโหว่ที่สำคัญสองรายการในการพิสูจน์การฉ้อโกงของ OP Stack ของ Optimism
รายงานข่าว ซอฟต์แวร์ เทคโนโลยี
Offchain Labs เผยการค้นพบช่องโหว่ที่สำคัญสองรายการในการพิสูจน์การฉ้อโกงของ OP Stack ของ Optimism
April 26, 2024
ตลาดเปิดของ Dymension สำหรับการเชื่อมโยงสภาพคล่องจาก RollApps eIBC เปิดตัวบน Mainnet
รายงานข่าว เทคโนโลยี
ตลาดเปิดของ Dymension สำหรับการเชื่อมโยงสภาพคล่องจาก RollApps eIBC เปิดตัวบน Mainnet 
April 26, 2024
CRYPTOMERIA LABS PTE. บจก.