StabilityAI công bố AI Music Generator Harmonai dựa trên Dance Diffusion Model
Tóm lại
Harmonai mang đến các mô hình âm thanh nguồn mở để giúp định hình tương lai của âm nhạc
Dance Diffusion nhằm mục đích làm cho việc sản xuất âm nhạc trở nên dễ tiếp cận và thú vị hơn cho mọi người
Với Harmonai, một phương pháp mới được gọi là khéo léo, bạn đoán nó, tạo ra âm thanh từ con số không, StabilityAICác nhà nghiên cứu của s đã đạt được bước tiến lớn trong lĩnh vực tạo âm thanh AI. Các kết quả thật đáng kinh ngạc và đa dạng, và tất cả chúng đều hơi đáng lo ngại.
Harmonai là gì?
hòa âm là một tổ chức hướng đến cộng đồng, xuất bản các công cụ âm thanh tổng hợp mã nguồn mở để tăng khả năng tiếp cận và thưởng thức sáng tác nhạc của mọi người. Nói một cách đơn giản, nó tạo ra những âm thanh chưa từng nghe thấy trong một quá trình gọi là phát sóng, trong đó tiếng ồn trắng ngẫu nhiên được tinh chỉnh thành âm thanh dựa trên mô hình đào tạo trước chứa hàng triệu thông số được tính toán trong quá trình đào tạo để gói gọn các đặc điểm của tài liệu nguồn mà nó được đào tạo.
Mục tiêu của phòng thí nghiệm nghiên cứu học sâu Harmonai là tạo ra các mô hình âm thanh tổng quát nguồn mở, hỗ trợ các nhà nghiên cứu và nhà phát triển thông qua tài trợ điện toán và cộng đồng, đồng thời cung cấp các công cụ sáng tạo mới cho các nghệ sĩ và chuyên gia âm thanh. Mục tiêu của Harmonai là làm cho việc sản xuất âm nhạc trở nên dễ tiếp cận và thú vị hơn cho mọi người bằng cách phát triển các công cụ xử lý và tổng hợp âm thanh nguồn mở.
Dance Diffusion là gì?
Hãy tưởng tượng Stable Diffusion chỉ tạo ra âm thanh thay vì hình ảnh. Nhảy Khuếch tán là tập hợp các mô hình phổ biến âm nhạc tổng hợp có sẵn công khai. Các mô hình ban đầu tạo ra âm thanh từ 1-3 giây và cũng có thể được sử dụng để nội suy và truyền kiểu các bản ghi âm thanh dài hơn.
Do đó, nó có giống với AI chuyển văn bản thành hình ảnh cho âm thanh không?
Về tinh thần, nhưng có một số khác biệt đáng kể. Không có biểu mẫu nhập văn bản nào để bạn có thể gõ “trống trống” và nhấn GO, vì vậy đây không phải là biểu mẫu nhập văn bản. văn bản thành âm thanh hoặc trình tạo văn bản thành giọng nói. Tất nhiên, đừng bao giờ nói không bao giờ—dự án này vẫn đang ở giai đoạn đầu—nhưng hiện tại, bạn, người dùng, có quyền cung cấp một nhóm tệp âm thanh (có thể là trống snare hoặc bất kỳ thứ gì bạn muốn để tạo ra các biến thể của ) để huấn luyện mô hình. Ngoài ra, bạn có thể sử dụng một trong 6 mô hình được đào tạo trước đã có trong Sổ ghi chép khiêu vũ để giúp bạn bắt đầu—và có rất nhiều điều thú vị khi chơi với chúng một mình!
Harmonai có liên quan đến Dadabots không?
Chuẩn rồi. Harmonai là dadabot + nhiều người tuyệt vời hơn + 4000 GPU. Trong kênh YouTube của họ, các nghệ sĩ của Dadabots đã sử dụng âm nhạc do AI tạo ra:
Các mẫu âm thanh AI mới được tạo bởi hòa âm
Theo dõi cộng đồng kênh bất hòa để nghe thêm các tập tin âm thanh.
Quan tâm đến việc đọc nhiều hơn? Dưới đây là một số tin tức bổ sung để kiểm tra:
Từ chối trách nhiệm
Phù hợp với Hướng dẫn của Dự án Tin cậy, xin lưu ý rằng thông tin được cung cấp trên trang này không nhằm mục đích và không được hiểu là tư vấn pháp lý, thuế, đầu tư, tài chính hoặc bất kỳ hình thức tư vấn nào khác. Điều quan trọng là chỉ đầu tư những gì bạn có thể đủ khả năng để mất và tìm kiếm lời khuyên tài chính độc lập nếu bạn có bất kỳ nghi ngờ nào. Để biết thêm thông tin, chúng tôi khuyên bạn nên tham khảo các điều khoản và điều kiện cũng như các trang trợ giúp và hỗ trợ do nhà phát hành hoặc nhà quảng cáo cung cấp. MetaversePost cam kết báo cáo chính xác, không thiên vị nhưng điều kiện thị trường có thể thay đổi mà không cần thông báo trước.
Giới thiệu về Tác giả
Damir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet.
Xem thêm bài viếtDamir là trưởng nhóm, quản lý sản phẩm và biên tập viên tại Metaverse Post, bao gồm các chủ đề như AI/ML, AGI, LLMs, Metaverse và Web3-các lĩnh vực liên quan. Các bài báo của anh ấy thu hút một lượng lớn độc giả với hơn một triệu người dùng mỗi tháng. Anh ấy có vẻ là một chuyên gia với 10 năm kinh nghiệm về SEO và tiếp thị kỹ thuật số. Damir đã được đề cập trong Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto và các ấn phẩm khác. Anh đi lại giữa Các Tiểu vương quốc Ả Rập Thống nhất, Thổ Nhĩ Kỳ, Nga và CIS với tư cách là một người du mục kỹ thuật số. Damir đã có bằng cử nhân vật lý, bằng cấp mà anh tin rằng đã mang lại cho anh những kỹ năng tư duy phản biện cần thiết để thành công trong bối cảnh luôn thay đổi của Internet.