VALL-E: Microsoft'un yeni sıfır atışlı metinden konuşmaya modeli, herkesin sesini üç saniye içinde çoğaltabilir
Kısaca
Transformatör tabanlı TTS modeli, herhangi bir sesin yalnızca üç saniyelik bir örneğiyle VALL-E her seste konuşma üretebilir.
Bu, kulağa daha doğal gelen TTS sistemleri yönünde önemli bir gelişmedir.
Bununla birlikte Microsoft, kullanımdaki modelin birkaç örneğini sağlamıştır ve bunun TTS teknolojisinde önemli bir gelişmeyi temsil ettiği açıktır.
İlk metinden konuşmaya (TTS) modelinin piyasaya sürülmesinden bu yana, araştırmacılar bu sistemlerin konuşma üretme şeklini iyileştirmenin yollarını arıyorlar. Microsoft'un en son modeli, VADİ, bu konuda ileriye doğru atılmış önemli bir adımdır.
VALL-E, o sesin yalnızca üç saniyelik bir örneğini duyduktan sonra herhangi bir seste konuşma üretebilen trafo tabanlı bir TTS modelidir. Bu, yeni bir ses oluşturmak için çok daha uzun bir eğitim süresi gerektiren önceki modellere göre önemli bir gelişmedir.
İlgili makale: Microsoft, bir kişinin tek bir fotoğrafından 3D avatar oluşturabilen bir yayılma modeli yayınladı. |
Ek olarak, sesin tonlaması, karizması ve stili, oluşturulan konuşmada olduğu gibi tutulur. Bu, TTS sistemlerini daha doğal hale getirmek için atılmış önemli bir adımdır.
Bu model trafo tabanlıdır ve Dale-1 görünümüne sahiptir. Difüzyon tabanlı Dalle-2 ile karıştırılmamalıdır. Kod hala eksik. Ve kullanıcıların yayınlayacaklarına dair bazı şüpheleri var.
İlgili makale: Microsoft'un VALL-E'si şimdiye kadarki en tehlikeli dolandırıcılık yazılımı gibi görünüyor |
Ancak Microsoft, modelin eylem halindeki birkaç örneğini yayınladı ve bunun TTS teknolojisinde büyük bir ilerleme olduğu açık.
Örnek #1:
Misal #2:
Örnek #3:
AI hakkında daha fazlasını okuyun:
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Damir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.
Daha fazla haberDamir şu anda ekip lideri, ürün yöneticisi ve editördür: Metaverse Post, AI/ML, AGI, LLM'ler, Metaverse ve Web3-İlgili alanlar. Makaleleri, her ay bir milyondan fazla kullanıcıdan oluşan büyük bir kitleyi kendine çekiyor. SEO ve dijital pazarlama konusunda 10 yıllık deneyime sahip bir uzman gibi görünüyor. Damir'den Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ve diğer yayınlar. Dijital bir göçebe olarak BAE, Türkiye, Rusya ve BDT arasında seyahat ediyor. Damir, kendisine internetin sürekli değişen ortamında başarılı olmak için gereken eleştirel düşünme becerilerini verdiğine inandığı fizik alanında lisans derecesi aldı.