OpenAI'S ChatGPT Meluncurkan Peningkatan Besar, Menambahkan Percakapan Suara dan Obrolan Gambar
Singkatnya
OpenAI akan meluncurkan kemampuan suara dan gambar baru ChatGPT selama dua minggu ke depan.
Fitur-fitur ini hanya akan tersedia untuk pengguna Plus dan Enterprise.
OpenAI hari ini mengumumkan bahwa mereka akan meluncurkan kemampuan suara dan gambar baru ChatGPT. Fitur-fitur baru akan memungkinkan pengguna untuk melakukan percakapan suara ChatGPT atau mengobrol dengan chatbot melalui gambar.
Pengumuman tersebut menyusul klaim dari pengguna Reddit yang mengklaim bahwa mereka telah memperoleh akses OpenAImodel dan kemudian membagikan informasi ini di platform. Redditor FeltSteam menggambarkan model AI dengan nama kerja Arrakis, yang dilaporkan memungkinkan pengguna untuk “memasukkan kombinasi teks, audio, dan video apa pun.”
“Kemampuan suara baru ini didukung oleh model text-to-speech baru, yang mampu menghasilkan audio mirip manusia hanya dari teks dan contoh ucapan beberapa detik,” tulis Open AI dalam sebuah posting blog. “Kami berkolaborasi dengan pengisi suara profesional untuk menciptakan setiap suara. Kami juga menggunakan Whisper, sistem pengenalan suara sumber terbuka kami, untuk menyalin kata-kata yang Anda ucapkan ke dalam teks.”
Saya menemukan beberapa spekulasi aneh yang belum dikonfirmasi tentang model internal yang kuat di Reddit.
— Yam Peleg (@Yampeleg) September 25, 2023
– Silakan ambil semuanya dengan sebutir garam. –
Rupanya,
Dua pengguna berbeda mengklaim bahwa mereka mendapat akses OpenAImodel internal dan berbagi informasi di reddit.
Merasa Uap… pic.twitter.com/JRJH4xADZX
Dengan fitur-fitur baru, pengguna dapat terlibat dalam percakapan bolak-balik ChatGPT menggunakan suara mereka. Mereka juga bisa berdiskusi tentang gambar dengan chatbot. Fitur-fitur tersebut akan diluncurkan dalam dua minggu ke depan untuk pengguna Plus dan Enterprise.
Kemampuan suara akan hadir di iOS dan Android sebagai pilihan sementara fitur gambar akan tersedia di semua platform.
Untuk mulai menggunakan fungsi suara, pengguna dapat menuju ke Pengaturan → Fitur Baru di aplikasi seluler dan memilih “percakapan suara”. Selanjutnya, pengguna harus mengetuk tombol headphone yang terdapat di sudut kanan atas layar beranda dan memilih suara pilihan mereka dari lima pilihan suara berbeda.
Untuk berbicara dengan ChatGPT melalui gambar, pengguna dapat mengetuk tombol foto untuk mengambil gambar atau memilih salah satu. Jika menggunakan iOS atau Android, ketuk tombol plus sebelum melanjutkan. Selain itu, mereka dapat terlibat dalam diskusi dengan banyak gambar atau menggunakannya untuk memandu chatbot.
OpenAI mengatakan bahwa pemahaman gambar didukung oleh multimodal GPT-35 dan. GPT-4. Model-model ini memanfaatkan kemampuan penalaran bahasa untuk menganalisis beragam konten visual, yang mencakup foto, tangkapan layar, dan dokumen yang berisi kombinasi teks dan gambar.
OpenAIkemitraan dengan Spotify
Spotify juga Hari ini mengumumkan fitur terjemahan suara bertenaga AI. Fitur baru ini dapat menerjemahkan podcast ke berbagai bahasa, memanfaatkan suara asli podcaster.
Menurut Verge, fitur terjemahan ini mengandalkan OpenAIAlat transkripsi suara milik Whisper yang mampu mentranskripsikan ucapan bahasa Inggris dan menerjemahkan berbagai bahasa ke dalam bahasa Inggris.
Sebagai bagian dari uji coba, perusahaan telah bekerja sama dengan podcaster Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons, dan Steven Bartlett untuk membuat terjemahan suara berbasis AI dalam bahasa seperti Spanyol, Prancis, dan Jerman untuk episode katalog tertentu dan yang akan datang. rilis.
“Kami percaya bahwa pendekatan AI yang bijaksana dapat membantu membangun hubungan yang lebih dalam antara pendengar dan pencipta, yang merupakan komponen kunci dari misi Spotify untuk membuka potensi kreativitas manusia,” Ziad Sultan, VP Personalisasi Spotify, mengatakan dalam sebuah pernyataan.
Episode terjemahan suara dari pembuat percontohan akan tersedia di seluruh dunia untuk pengguna Premium dan Gratis.
Penolakan tanggung jawab
Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.
Tentang Penulis
Cindy adalah seorang jurnalis di Metaverse Post, mencakup topik yang terkait dengan web3, NFT, metaverse dan AI, dengan fokus pada wawancara dengan Web3 pelaku industri. Dia telah berbicara dengan lebih dari 30 eksekutif tingkat C dan terus bertambah, menyampaikan wawasan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini tinggal di Tbilisi, Georgia. Beliau meraih gelar Sarjana Komunikasi & Studi Media dari University of South Australia dan memiliki pengalaman satu dekade di bidang jurnalisme dan penulisan. Hubungi dia melalui [email dilindungi] dengan pitches pers, pengumuman dan peluang wawancara.
lebih artikelCindy adalah seorang jurnalis di Metaverse Post, mencakup topik yang terkait dengan web3, NFT, metaverse dan AI, dengan fokus pada wawancara dengan Web3 pelaku industri. Dia telah berbicara dengan lebih dari 30 eksekutif tingkat C dan terus bertambah, menyampaikan wawasan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini tinggal di Tbilisi, Georgia. Beliau meraih gelar Sarjana Komunikasi & Studi Media dari University of South Australia dan memiliki pengalaman satu dekade di bidang jurnalisme dan penulisan. Hubungi dia melalui [email dilindungi] dengan pitches pers, pengumuman dan peluang wawancara.