Fısıltı V3 tarafından OpenAI Açık Kaynağa Geçerek Ses Tanıma Özelliğini Diller Arasında Genişletiyor
Kısaca
OpenAI birden fazla dilde ses tanıma için son teknoloji ürünü bir model olan WHISPER V3'ün açık kaynaklı sürümünü duyurdu.
Yapay zeka (AI) araştırma şirketi OpenAI, son teknoloji modelini açık kaynaklı hale getirerek konuşma tanıma alanında önemli bir adım attı Fısıltı büyük-v3Geliştirici Günü etkinlikleri sırasında.
Whisper modelinin bu en son yinelemesi, çok sayıda dilde sesi anlama ve yazıya dökme konusunda dikkate değer bir yetenek sergiliyor ve uygulanabilirliğini geçmişin İngilizce merkezli modellerinin ötesine taşıyor.
Whisper Large-v3, çeşitli dil girişlerini ustaca işleyerek çeşitli koşullarda gelişir. Göre OpenAIgibi İngilizce uygulamaları hedefleyen modeller ise tiny.en
ve base.en
üstün performans gösterir. Ancak Whisper Large-v3'ün etkililiği, yazıya aktarılan dile bağlı olarak dalgalanmalara tabidir.
Geçtiğimiz Eylül ayında piyasaya sürüldüğünde başlangıçta İngilizceye odaklanan model, Aralık ayında sürüm 2 ile yeteneklerini bir dizi dil desteğini içerecek şekilde genişletti, ancak hangi dil olduğunu belirtmedi.
Whisper Large-v3, izin verilen bir lisans kapsamında mevcuttur GitHub, kullanıcıların çeşitli içerik biçimlerini sınıfının en iyisi doğrulukla yazıya dökmesine olanak tanır. Benzersiz zaman damgası özelliği, önemli bir değer katarak, aşağıdaki gibi video platformlarında altyazı oluşturmada devrim yaratma potansiyeli taşıyor YouTube.
OpenAIÇok Dilli Konuşma Tanıma Teknolojisinde Çığır Açan Gelişme
Whisper Large-v3, sesi önce 30 saniyelik kliplere bölerek ve ardından çıkışı oluşturmak için bir kodlayıcı ve kod çözücü içeren karmaşık bir sistem aracılığıyla çalıştırarak işler.
Bu bileşenler, konuşulan kelimelerin metinsel transkripsiyonunu tahmin etmek için birlikte çalışır. Whisper Large-v3'ün öne çıkan teknik özelliklerinden biri, yalnızca çok dilli konuşmayı yazıya dökmekle kalmayıp aynı zamanda onu İngilizceye çeviren dil tanımlama özelliğidir.
İlk planlar popüler olanlarla entegrasyonu önerirken ChatGPT chatbot ile doğrudan sesli etkileşimi kolaylaştırmak için, OpenAI Whisper Large-v3'e kamuya doğrudan erişim izni vermeyi seçti. Whisper'ın mevcut hedef kitlesinin genel halk değil, öncelikle araştırmacılar olduğunu belirtmekte fayda var.
OpenAI'nin sağlam konuşma işlemeyi geliştirmeye olan bağlılığı, açık kaynak Whisper büyük v3'e karar vermelerinde açıkça görülüyor. Kuruluş, bu alanda pratik uygulamaların ve daha fazla araştırmanın geliştirilmesini teşvik etme hedefinin altını çiziyor.
OpenAI AI aracını, önemli miktarda İngilizce olmayan ses de dahil olmak üzere, internetten toplanan 680,000 saatlik yakından izlenen verileri içeren geniş bir veri kümesiyle geliştirdi. Bu adım, yenilikçiliği teşvik etmeyi ve dünya çapında ses tanıma teknolojisinin kapsamını genişletmeyi amaçlıyor.
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Nik başarılı bir analist ve yazardır. Metaverse Post, AI/ML, XR, VR, zincir üstü analitik ve blok zinciri geliştirmeye özel bir vurgu yaparak, hızlı tempolu teknoloji dünyasına en son bilgileri sağlama konusunda uzmanlaşmıştır. Makaleleri, teknolojik eğrinin bir adım önünde olmalarına yardımcı olarak, farklı bir kitleyi meşgul eder ve bilgilendirir. Ekonomi ve Yönetim alanında yüksek lisans derecesine sahip olan Nik, iş dünyasının nüansları ve onun gelişmekte olan teknolojilerle kesişimi hakkında sağlam bir kavrayışa sahiptir.
Daha fazla haberNik başarılı bir analist ve yazardır. Metaverse Post, AI/ML, XR, VR, zincir üstü analitik ve blok zinciri geliştirmeye özel bir vurgu yaparak, hızlı tempolu teknoloji dünyasına en son bilgileri sağlama konusunda uzmanlaşmıştır. Makaleleri, teknolojik eğrinin bir adım önünde olmalarına yardımcı olarak, farklı bir kitleyi meşgul eder ve bilgilendirir. Ekonomi ve Yönetim alanında yüksek lisans derecesine sahip olan Nik, iş dünyasının nüansları ve onun gelişmekte olan teknolojilerle kesişimi hakkında sağlam bir kavrayışa sahiptir.