Haber Raporu Teknoloji
07 Kasım 2023

Fısıltı V3 tarafından OpenAI Açık Kaynağa Geçerek Ses Tanıma Özelliğini Diller Arasında Genişletiyor

Kısaca

OpenAI birden fazla dilde ses tanıma için son teknoloji ürünü bir model olan WHISPER V3'ün açık kaynaklı sürümünü duyurdu.

OpenAI Whisper V3'ü Tanıtıyor: Diller Arasında Ses Tanımada Devrim Yaratıyor

Yapay zeka (AI) araştırma şirketi OpenAI, son teknoloji modelini açık kaynaklı hale getirerek konuşma tanıma alanında önemli bir adım attı Fısıltı büyük-v3Geliştirici Günü etkinlikleri sırasında.

Whisper modelinin bu en son yinelemesi, çok sayıda dilde sesi anlama ve yazıya dökme konusunda dikkate değer bir yetenek sergiliyor ve uygulanabilirliğini geçmişin İngilizce merkezli modellerinin ötesine taşıyor.

Whisper Large-v3, çeşitli dil girişlerini ustaca işleyerek çeşitli koşullarda gelişir. Göre OpenAIgibi İngilizce uygulamaları hedefleyen modeller ise tiny.en ve base.en üstün performans gösterir. Ancak Whisper Large-v3'ün etkililiği, yazıya aktarılan dile bağlı olarak dalgalanmalara tabidir.

Geçtiğimiz Eylül ayında piyasaya sürüldüğünde başlangıçta İngilizceye odaklanan model, Aralık ayında sürüm 2 ile yeteneklerini bir dizi dil desteğini içerecek şekilde genişletti, ancak hangi dil olduğunu belirtmedi.

Whisper Large-v3, izin verilen bir lisans kapsamında mevcuttur GitHub, kullanıcıların çeşitli içerik biçimlerini sınıfının en iyisi doğrulukla yazıya dökmesine olanak tanır. Benzersiz zaman damgası özelliği, önemli bir değer katarak, aşağıdaki gibi video platformlarında altyazı oluşturmada devrim yaratma potansiyeli taşıyor YouTube.

Kaynak: OpenAI

OpenAIÇok Dilli Konuşma Tanıma Teknolojisinde Çığır Açan Gelişme

Whisper Large-v3, sesi önce 30 saniyelik kliplere bölerek ve ardından çıkışı oluşturmak için bir kodlayıcı ve kod çözücü içeren karmaşık bir sistem aracılığıyla çalıştırarak işler.

Bu bileşenler, konuşulan kelimelerin metinsel transkripsiyonunu tahmin etmek için birlikte çalışır. Whisper Large-v3'ün öne çıkan teknik özelliklerinden biri, yalnızca çok dilli konuşmayı yazıya dökmekle kalmayıp aynı zamanda onu İngilizceye çeviren dil tanımlama özelliğidir.

İlk planlar popüler olanlarla entegrasyonu önerirken ChatGPT chatbot ile doğrudan sesli etkileşimi kolaylaştırmak için, OpenAI Whisper Large-v3'e kamuya doğrudan erişim izni vermeyi seçti. Whisper'ın mevcut hedef kitlesinin genel halk değil, öncelikle araştırmacılar olduğunu belirtmekte fayda var.

OpenAI'nin sağlam konuşma işlemeyi geliştirmeye olan bağlılığı, açık kaynak Whisper büyük v3'e karar vermelerinde açıkça görülüyor. Kuruluş, bu alanda pratik uygulamaların ve daha fazla araştırmanın geliştirilmesini teşvik etme hedefinin altını çiziyor.

OpenAI AI aracını, önemli miktarda İngilizce olmayan ses de dahil olmak üzere, internetten toplanan 680,000 saatlik yakından izlenen verileri içeren geniş bir veri kümesiyle geliştirdi. Bu adım, yenilikçiliği teşvik etmeyi ve dünya çapında ses tanıma teknolojisinin kapsamını genişletmeyi amaçlıyor.

Feragatname

Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.

Yazar hakkında

Nik başarılı bir analist ve yazardır. Metaverse Post, AI/ML, XR, VR, zincir üstü analitik ve blok zinciri geliştirmeye özel bir vurgu yaparak, hızlı tempolu teknoloji dünyasına en son bilgileri sağlama konusunda uzmanlaşmıştır. Makaleleri, teknolojik eğrinin bir adım önünde olmalarına yardımcı olarak, farklı bir kitleyi meşgul eder ve bilgilendirir. Ekonomi ve Yönetim alanında yüksek lisans derecesine sahip olan Nik, iş dünyasının nüansları ve onun gelişmekte olan teknolojilerle kesişimi hakkında sağlam bir kavrayışa sahiptir.

Daha fazla haber
Nik Asti
Nik Asti

Nik başarılı bir analist ve yazardır. Metaverse Post, AI/ML, XR, VR, zincir üstü analitik ve blok zinciri geliştirmeye özel bir vurgu yaparak, hızlı tempolu teknoloji dünyasına en son bilgileri sağlama konusunda uzmanlaşmıştır. Makaleleri, teknolojik eğrinin bir adım önünde olmalarına yardımcı olarak, farklı bir kitleyi meşgul eder ve bilgilendirir. Ekonomi ve Yönetim alanında yüksek lisans derecesine sahip olan Nik, iş dünyasının nüansları ve onun gelişmekte olan teknolojilerle kesişimi hakkında sağlam bir kavrayışa sahiptir.

Hot Stories
Bültenimize Katılın.
En Yeni Haberler

Ripple'dan Büyük Yeşil DAO'ya: Kripto Para Projeleri Hayırseverliğe Nasıl Katkıda Bulunuyor?

Hayırsever amaçlar için dijital para birimlerinin potansiyelinden yararlanan girişimleri keşfedelim.

bilmek Daha

AlphaFold 3, Med-Gemini ve diğerleri: Yapay Zekanın 2024'te Sağlık Hizmetlerini Dönüştürme Yolu

Yapay zeka, yeni genetik korelasyonların ortaya çıkarılmasından robotik cerrahi sistemlerin güçlendirilmesine kadar sağlık hizmetlerinde çeşitli şekillerde kendini gösteriyor...

bilmek Daha
Yenilikçi Teknoloji Topluluğumuza Katılın
Devamını Oku
Daha fazla
İçerik Oluşturma, Video Düzenleme ve Daha Fazlası için En İyi 10 Ücretsiz Yapay Zeka Aracı
AI Wiki özet Eğitim Yaşam Tarzı Yazılım Teknoloji
İçerik Oluşturma, Video Düzenleme ve Daha Fazlası için En İyi 10 Ücretsiz Yapay Zeka Aracı
Mayıs 14, 2024
Hong Kong Menkul Kıymetler Komisyonu, Kripto Sektörünü Hedef Alan Deepfake Dolandırıcılıkları Konusunda Uyardı: Yatırımcı Güvenliğine Etkileri
Yaşam Tarzı Güvenlik Wiki Yazılım Hikayeler ve İncelemeler Teknoloji
Hong Kong Menkul Kıymetler Komisyonu, Kripto Sektörünü Hedef Alan Deepfake Dolandırıcılıkları Konusunda Uyardı: Yatırımcı Güvenliğine Etkileri
Mayıs 14, 2024
Ripple ve Evmos, EvmOS Teknolojisiyle XRP Ledger EVM Yan Zincirini Geliştirmek İçin İşbirliği Yapıyor
İşletme Haber Raporu Teknoloji
Ripple ve Evmos, EvmOS Teknolojisiyle XRP Ledger EVM Yan Zincirini Geliştirmek İçin İşbirliği Yapıyor
Mayıs 14, 2024
5ireChain, Ağ Stres Testi İçin Teşvik Edilen 'Testnet Thunder: GA'yı Başlatıyor, Kullanıcıları Katılmaya Davet Ediyor Airdrop "Rewards"
Haber Raporu Teknoloji
5ireChain, Ağ Stres Testi İçin Teşvik Edilen 'Testnet Thunder: GA'yı Başlatıyor, Kullanıcıları Katılmaya Davet Ediyor Airdrop "Rewards"
Mayıs 14, 2024
CRYPTOMERIA LABS PTE. LTD.