Google AI, İlk Metinden Müziğe Dönüştürücü AudioLM'yi Duyurdu
Kısaca
AudioLM, yalnızca sesleri dinleyerek müzik üretebilir
Mubert AI, insan konuşmasına ve piyano müziğine devam edecek
İle GPT-3 ve diğerleri, üretken yapay zeka fikrinin ilerleme şansının yüksek olduğunu düşünüyor. Ayrıca iç boyama ve dış boyama kavramlarını da keşfettik; Yapay zeka, temayı ve stili korurken görüntüleri ustalıkla tamamlıyor. Müzik hakkında ne düşünüyorsun?
Ve yine! Tüm bunlar, anlamı koruyan yapay zeka dil modellerine dayandığından, bu teknolojinin müziğe uygulanması an meselesiydi. Ve şimdi zamanı geldi.
Yakın tarihli Google araştırmasına göre, AudioLM adlı yeni bir ses üretimi çerçevesi, yalnızca sesleri dinleyerek gerçekçi konuşma ve piyano müziği oluşturmayı öğretebilir. AudioLM, uzun vadeli tutarlılığı ve mükemmel doğruluğu sayesinde önceki sistemleri geride bırakır ve ses sentezi ve bilgisayar destekli müzik uygulamalarıyla ses oluşturmayı ilerletir.
Ses LM Google AI'dan "amacı" korurken akustik bir pasajı uzatabilir. Şu an itibariyle, sınırlı bir girdi verisi örneğine dayalı olarak insan konuşmasını ve piyano müziğini sürdürmek üzere eğitildi. Aşağıdaki örneği kontrol edin.
Konuşma kriterleri açıktı: Dinleyicilerden devamın kulağa insan konuşması gibi gelip gelmediğini değerlendirmeleri istendi. Müzikle birlikte, giriş için sağlanan bölümün "devamı" nın, şu anki tüm sıfırdan müzik üreteçlerinden kalite açısından çok daha üstün olduğu keşfedildi. müzik kutusu. Girdideki bir öneriyle, yapay zeka müziği önemli ölçüde daha iyi sürdürür.
İnsan puanlayıcılar, sonuçları doğrulamak için ses örneklerini dinledi. Kaydedilmiş bir insan sesinin gerçek bir devamını mı yoksa AudioLM tarafından üretilen yapay bir sesi mi işittiklerini belirlediler. Verileri, %51.2'lik bir başarı oranını gösteriyor. Sonuç olarak, ortalama bir dinleyicinin AudioLM tarafından üretilen konuşma ile gerçek insan konuşmasını ayırt etmesi zor olacaktır.
Metinden müziğe dönüştürme teknolojisi müzik işini değiştirir mi?
dayalı bir metin-müzik üreteci Mubert API'si yakın zamanda başka bir yapay zeka modeli olan Mubert tarafından duyuruldu. Mubert, gönderdiğiniz her istek için farklı bir ses seti oluşturur. Tekrarlanma ihtimali gerçekten çok zayıf. Bir istek yapıldığında müzik yaratılır; bitmiş melodilerin bulunduğu bir veritabanından alınmamıştır. Ne kadar gerçekten üretken bu müzik Bu yaygın bir sorudur.
Sesler oluşturulmadan önce seçilir. Hem giriş istemi hem de Mubert API etiketleri, bir dönüştürücü sinir ağının gizli uzay vektörüne kodlanmıştır. Daha sonra her sorgu için en yakın etiket vektörü seçilir ve eşlik eden etiketler, müzik oluşturmak için API'mize iletilir. Seslerin hiçbirini oluşturmak için hiçbir sinir ağı kullanılmadı (bas, elektrotlar vb. için ayrı döngüler); tüm sesler müzisyenler ve ses tasarımcıları tarafından üretildi.
Mubert'in bir sonraki önemli adımı, fotoğraflar, filmler, senaryolar ve sunumlar gibi mevcut dünyadan öğeler almak ve etrafınızdaki dünyanın müziğini yaratmaktır.
Mubert AI müzikalinin ağzına pervasızca metin istemleri koyarak şunları elde edebilirsiniz:
Bu, daha sofistike ve hassas bir üretim algoritması oluşturma sürecindeki ilk aşamadır, ancak bu, zaman ve para alacaktır.
Bununla birlikte, metinden müziğe dönüştürme teknolojisi zaten mevcuttur, bu nedenle "rastgele bir bilgi istemi komut dosyası yaz" için "giriş istemi"ni devre dışı bırakarak toplu olarak albümler oluşturabilirsiniz. Görünüşe göre sanatçılara artık gerek yok.
Daha fazla ilgili haber okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.