OpenAI'S ChatGPT Büyük Yükseltmeyi Açıklıyor, Sesli Konuşma ve Görüntülü Sohbet Ekliyor
Kısaca
OpenAI yeni ses ve görüntü yeteneklerini kullanıma sunacak ChatGPT önümüzdeki iki hafta boyunca.
Bu özellikler yalnızca Plus ve Enterprise kullanıcılarına sunulacaktır.
OpenAI bugün yeni ses ve görüntü yeteneklerini kullanıma sunacağını duyurdu. ChatGPT. Yeni özellikler, kullanıcıların sesli görüşme yapmasına olanak tanıyacak ChatGPT veya chatbot ile görüntüler aracılığıyla sohbet edin.
Duyuru, Reddit kullanıcılarının erişim elde ettiklerini iddia eden iddialarının ardından geldi. OpenAI'nin modellerini oluşturdu ve ardından bu bilgiyi platformda paylaştı. Reddit yazarı FeltSteam, Arrakis çalışma adını taşıyan ve kullanıcıların "metin, ses ve videonun herhangi bir kombinasyonunu girmesine" olanak tanıyan bir yapay zeka modelini açıkladı.
Open AI, "Yeni ses yeteneği, yalnızca metinden ve birkaç saniyelik örnek konuşmadan insan benzeri ses üretebilen yeni bir metinden konuşmaya modeliyle destekleniyor" diye yazdı. blog yazısı. “Seslerin her birini oluşturmak için profesyonel seslendirme sanatçılarıyla işbirliği yaptık. Ayrıca açık kaynaklı konuşma tanıma sistemimiz Whisper'ı, söylediğiniz sözcükleri metne dönüştürmek için de kullanıyoruz."
Reddit'te güçlü dahili modeller hakkında bazı tuhaf, doğrulanmamış spekülasyonlar buldum.
— Yam Peleg (@Yampeleg) Eylül 25, 2023
– Lütfen her şeyi ihtiyatla karşılayın. –
Görünüşe göre,
İki farklı kullanıcı erişime sahip olduklarını iddia ediyor OpenAI'nin dahili modelleri ve bilgileri reddit'te paylaşılıyor.
Keçe Buhar… pic.twitter.com/JRJH4xADZX
Yeni özellikler sayesinde kullanıcılar, kullanıcılarla ileri geri sohbet edebilecek. ChatGPT seslerini kullanıyorlar. Ayrıca chatbot ile görseller hakkında da tartışabilirler. Özellikler önümüzdeki iki hafta içinde Plus ve Enterprise kullanıcılarına sunulacak.
Ses özelliği iOS ve Android'e isteğe bağlı olarak gelecek, görüntü özelliği ise tüm platformlarda mevcut olacak.
Kullanıcılar, ses işlevini kullanmaya başlamak için mobil uygulamada Ayarlar → Yeni Özellikler bölümüne giderek "sesli konuşmalar"ı tercih edebilir. Daha sonra kullanıcı, ana ekranın sağ üst köşesinde bulunan kulaklık düğmesine dokunmalı ve beş farklı ses arasından tercih ettiği sesi seçmelidir.
Konuşmak için ChatGPT Kullanıcı, görüntüler aracılığıyla bir görüntü yakalamak veya birini seçmek için fotoğraf düğmesine dokunabilir. iOS veya Android kullanıyorsanız devam etmeden önce artı düğmesine dokunun. Ayrıca birden fazla görselle tartışmalara katılabilir veya bunları chatbot'a rehberlik etmek için kullanabilirler.
OpenAI görüntü anlayışının multimodal tarafından desteklendiğini söylüyor GPT-3. 5 ve GPT-4. Bu modeller, fotoğraflar, ekran görüntüleri ve metin ve görüntülerin bir kombinasyonunu içeren belgeleri kapsayan çok çeşitli görsel içeriği analiz etmek için dil muhakemesi yeteneklerinden yararlanır.
OpenAISpotify ile ortaklığı
Spotify'ı da bugün ilan etti AI destekli sesli çeviri özelliği. Yeni özellik, podcast yayıncısının orijinal sesini kullanarak podcast'leri farklı dillere çevirebiliyor.
Göre Verge, bu çeviri özelliği şunlara dayanır: OpenAI'nin İngilizce konuşmaları yazıya dökebilen ve çeşitli dilleri İngilizceye çevirebilen ses transkripsiyon aracı Whisper.
Pilot çalışmanın bir parçası olarak şirket, belirli katalog bölümleri ve yakında yayınlanacak bölümler için İspanyolca, Fransızca ve Almanca gibi dillerde yapay zeka destekli sesli çeviriler oluşturmak amacıyla podcast yayıncıları Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons ve Steven Bartlett ile birlikte çalıştı. Salıverme.
Spotify Kişiselleştirmeden Sorumlu Başkan Yardımcısı Ziad Sultan yaptığı açıklamada, "Yapay zekaya yönelik düşünceli bir yaklaşımın, Spotify'ın insan yaratıcılığının potansiyelini açığa çıkarma misyonunun temel bir bileşeni olan dinleyiciler ve yaratıcılar arasında daha derin bağlantılar kurmaya yardımcı olabileceğine inanıyoruz." dedi.
Pilot yaratıcıların sesli tercümesi yapılan bölümler dünya çapındaki Premium ve Ücretsiz kullanıcılara sunulacak.
Feragatname
Doğrultusunda Trust Project yönergeleri, lütfen bu sayfada sağlanan bilgilerin hukuki, vergi, yatırım, finansal veya başka herhangi bir tavsiye niteliğinde olmadığını ve bu şekilde yorumlanmaması gerektiğini unutmayın. Yalnızca kaybetmeyi göze alabileceğiniz kadar yatırım yapmak ve herhangi bir şüpheniz varsa bağımsız finansal tavsiye almak önemlidir. Daha fazla bilgi için şartlar ve koşulların yanı sıra kartı veren kuruluş veya reklamveren tarafından sağlanan yardım ve destek sayfalarına bakmanızı öneririz. MetaversePost doğru, tarafsız raporlamaya kendini adamıştır, ancak piyasa koşulları önceden haber verilmeksizin değiştirilebilir.
Yazar hakkında
Cindy bir gazetecidir. Metaverse Postile ilgili konuları kapsayan web3, NFT, metaverse ve AI ile yapılan görüşmelere odaklanarak Web3 endüstri oyuncuları. 30'dan fazla C düzeyindeki yöneticiyle konuştu ve onların değerli görüşlerini okuyuculara aktardı. Aslen Singapurlu olan Cindy şu anda Gürcistan'ın Tiflis şehrinde yaşıyor. Güney Avustralya Üniversitesi'nden İletişim ve Medya Çalışmaları alanında lisans derecesine sahiptir ve gazetecilik ve yazarlık alanında on yıllık deneyime sahiptir. Onunla iletişime geçin [e-posta korumalı] basın açıklamaları, duyurular ve röportaj imkanları ile.
Daha fazla haberCindy bir gazetecidir. Metaverse Postile ilgili konuları kapsayan web3, NFT, metaverse ve AI ile yapılan görüşmelere odaklanarak Web3 endüstri oyuncuları. 30'dan fazla C düzeyindeki yöneticiyle konuştu ve onların değerli görüşlerini okuyuculara aktardı. Aslen Singapurlu olan Cindy şu anda Gürcistan'ın Tiflis şehrinde yaşıyor. Güney Avustralya Üniversitesi'nden İletişim ve Medya Çalışmaları alanında lisans derecesine sahiptir ve gazetecilik ve yazarlık alanında on yıllık deneyime sahiptir. Onunla iletişime geçin [e-posta korumalı] basın açıklamaları, duyurular ve röportaj imkanları ile.