Haber Raporu Teknoloji
Ocak 03, 2024

AI Startup MyShell, Hassas Ses Klonlaması için OpenVoice Algoritmasını Yayınladı

Kısaca

Kanadalı yapay zeka girişimi MyShell, anında ses klonlama için OpenVoice algoritmasını açık kaynaklı hale getirdiğini duyurdu.

AI Startup MyShell, Hassas Ses Klonlaması için OpenVoice Algoritmasını Yayınladı

Respeecher, Voicemod ve Eleven Laboratuvarları – her üç girişimin de ortak bir yanı var; hepsi ses klonları yapmak için algoritmalar ve yapay zeka yazılımı sağlıyor. Şimdi yeni bir oyuncu, Kanadalı yapay zeka girişimi MyShell'im anında ses klonlama için OpenVoice algoritmasını açık kaynaklı hale getirdiğini duyurdu.

MyShell güncellemeyi şu tarihte paylaştı: sosyal medya platformu X ve şöyle dedi: "Yalnızca küçük bir ses klibi kullanarak sesleri benzersiz bir hassasiyetle, duygudan aksan, ritim, duraklamalar ve tonlamaya kadar ayrıntılı ton kontrolüyle klonlayın."

İşbirliği kapsamında, MIT, MyShell.ai ve Tsinghua Üniversitesi'nden araştırmacılar, konuşmacının sesini taklit edebilen ve konuşma oluşturabilen OpenVoice'u tanıttı. birden fazla dil, orijinal kaynaktan yalnızca kısa bir ses parçasını kullanarak. Ayrıca konuşmacının sesinin benzersiz tonunu ve rengini de yakalar.

Şirkete göre algoritma; duygu, vurgu, ritim, duraklamalar ve tonlama gibi önemli stilistik unsurları ekliyor. Bu öğeler, konuşmanın gerçek gibi görünmesi ve ilginç konuşmalar yaratılması açısından çok önemlidir. Normal metin okuma özelliğinde sıklıkla karşılaştığınız sıkıcı seslerden kaçınmanıza yardımcı olur.

Ses Klonlama Yapay Zeka Modeli Nasıl Çalışır?

İçinde Araştırma kağıdıOpenVoice, ses klonlama yapay zekasının arkasındaki metodolojiyi paylaştı. OpenVoice iki farklı bileşenden oluşur AI modelleri: bir metinden konuşmaya (TTS) modeli ve bir "ton dönüştürücü."

Model, stil parametrelerini ve dilleri yönetebiliyor ve İngilizce (hem Amerikan hem de İngiliz aksanıyla), Çince ve Japonca konuşanlardan “30,000 cümle kullanarak eğitim” aldı. Eğitim, örneklerin ifade edilen duygulara göre etiketlenmesini içeriyordu ve model, bu ses kliplerinden tonlama, ritim ve duraklamaları öğrendi.

Öte yandan ton dönüştürücü modeli, 300,000'den fazla farklı hoparlörden alınan 20,000'in üzerinde ses örneğinden oluşan geniş bir veri kümesi üzerinde eğitildi. Her iki durumda da, insan konuşma sesi, fonemlere (kelimeleri farklılaştıran belirli seslere) dönüştürüldü ve vektör yerleştirmeler kullanılarak temsil edildi.

Bir "temel hoparlör" kullanan TTS modeli, eğitim sürecinde kullanıcının kaydettiği sesten elde edilen tonla birleşir. Bu iki model birlikte kullanıcının sesini taklit edebilir ve ton rengini, yani konuşulan metinde iletilen duygusal ifadeyi değiştirebilir.

Girişim 2023 yılında kuruldu. Geçtiğimiz yıl MyShell, INCE Capital liderliğinde 5.6 milyon dolar tohum finansmanı topladı ve diğerlerinin yanı sıra Folius Ventures, Hashkey Capital, SevenX Ventures, TSVC ve OP Crypto gibi önde gelen yatırımcıların katılımını gördü.

Şirkete göre, finansman tescilli şirketlerin ilerlemesine yardımcı olacak AI modelleri, yapay zekaya özgü uygulamalar için özel olarak tasarlanmış bir İçerik Stüdyosu'nun oluşturulması ve blockchain teknolojisi alanında canlı bir içerik oluşturucu ekosisteminin kurulması.

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Kumar, AI/ML, pazarlama teknolojisi ve kripto, blockchain gibi yeni ortaya çıkan alanların dinamik kesişimleri konusunda uzmanlığa sahip deneyimli bir Teknoloji Gazetecisidir. NFTS. Sektördeki 3 yılı aşkın tecrübesiyle Kumar, ilgi çekici anlatılar oluşturma, aydınlatıcı röportajlar yürütme ve kapsamlı bilgiler sunma konusunda kanıtlanmış bir performansa sahiptir. Kumar'ın uzmanlığı, önde gelen endüstri platformları için makaleler, raporlar ve araştırma yayınları dahil olmak üzere yüksek etkili içerik üretmede yatmaktadır. Teknik bilgi ile hikaye anlatıcılığını birleştiren benzersiz beceri seti ile Kumar, karmaşık teknolojik kavramları farklı hedef kitlelere açık ve ilgi çekici bir şekilde aktarma konusunda uzmandır.

Daha fazla haber
Kumar Gandharv
Kumar Gandharv

Kumar, AI/ML, pazarlama teknolojisi ve kripto, blockchain gibi yeni ortaya çıkan alanların dinamik kesişimleri konusunda uzmanlığa sahip deneyimli bir Teknoloji Gazetecisidir. NFTS. Sektördeki 3 yılı aşkın tecrübesiyle Kumar, ilgi çekici anlatılar oluşturma, aydınlatıcı röportajlar yürütme ve kapsamlı bilgiler sunma konusunda kanıtlanmış bir performansa sahiptir. Kumar'ın uzmanlığı, önde gelen endüstri platformları için makaleler, raporlar ve araştırma yayınları dahil olmak üzere yüksek etkili içerik üretmede yatmaktadır. Teknik bilgi ile hikaye anlatıcılığını birleştiren benzersiz beceri seti ile Kumar, karmaşık teknolojik kavramları farklı hedef kitlelere açık ve ilgi çekici bir şekilde aktarma konusunda uzmandır.

Hot Stories
Bültenimize Katılın.
En Yeni Haberler

Volatilite Ortasında Bitcoin ETF'lerine Yönelik Kurumsal İştah Artıyor

13F başvuruları aracılığıyla yapılan açıklamalar, önemli kurumsal yatırımcıların Bitcoin ETF'leriyle uğraştığını ortaya koyuyor ve Bitcoin ETF'lerinin artan bir şekilde kabul edildiğinin altını çiziyor.

bilmek Daha

Hüküm Günü Geliyor: ABD Mahkemesi Adalet Bakanlığı'nın Savunmasını Değerlendirirken CZ'nin Kaderi Dengede

Changpeng Zhao bugün Seattle'daki bir ABD mahkemesinde cezayla karşı karşıya kalmaya hazırlanıyor.

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
NuLink Bybit'te Başlıyor Web3 İDO Platformu. Abonelik Aşaması 13 Mayıs'a Kadar Uzatılıyor
Piyasalar Haber Raporu Teknoloji
NuLink Bybit'te Başlıyor Web3 İDO Platformu. Abonelik Aşaması 13 Mayıs'a Kadar Uzatılıyor
Mayıs 9, 2024
UXLINK ve Binance Yeni Kampanyada İşbirliği Yaparak Kullanıcılara 20 Milyon UXUY Puanı Sunuyor Airdrop "Rewards"
Piyasalar Haber Raporu Teknoloji
UXLINK ve Binance Yeni Kampanyada İşbirliği Yaparak Kullanıcılara 20 Milyon UXUY Puanı Sunuyor Airdrop "Rewards"
Mayıs 9, 2024
Side Protokolü, Teşvik Edilmiş Test Ağını Başlatıyor ve Kullanıcıların SIDE Puanları Kazanmasına Olanak Sağlayan Insider Puan Sistemini Tanıtıyor
Piyasalar Haber Raporu Teknoloji
Side Protokolü, Teşvik Edilmiş Test Ağını Başlatıyor ve Kullanıcıların SIDE Puanları Kazanmasına Olanak Sağlayan Insider Puan Sistemini Tanıtıyor
Mayıs 9, 2024
Web3 ve Mayıs 2024'teki Kripto Etkinlikleri: Blockchain'de Yeni Teknolojileri ve Yükselen Trendleri Keşfetmek ve DeFi
özet İşletme Piyasalar Teknoloji
Web3 ve Mayıs 2024'teki Kripto Etkinlikleri: Blockchain'de Yeni Teknolojileri ve Yükselen Trendleri Keşfetmek ve DeFi
Mayıs 9, 2024
CRYPTOMERIA LABS PTE. LTD.