Laporan berita Teknologi
September 25, 2023

OpenAI'S ChatGPT Meluncurkan Peningkatan Besar, Menambahkan Percakapan Suara dan Obrolan Gambar

Singkatnya

OpenAI akan meluncurkan kemampuan suara dan gambar baru ChatGPT selama dua minggu ke depan.

Fitur-fitur ini hanya akan tersedia untuk pengguna Plus dan Enterprise.

OpenAI hari ini mengumumkan bahwa mereka akan meluncurkan kemampuan suara dan gambar baru ChatGPT. Fitur-fitur baru akan memungkinkan pengguna untuk melakukan percakapan suara ChatGPT atau mengobrol dengan chatbot melalui gambar.

Pengumuman tersebut menyusul klaim dari pengguna Reddit yang mengklaim bahwa mereka telah memperoleh akses OpenAImodel dan kemudian membagikan informasi ini di platform. Redditor FeltSteam menggambarkan model AI dengan nama kerja Arrakis, yang dilaporkan memungkinkan pengguna untuk “memasukkan kombinasi teks, audio, dan video apa pun.”

“Kemampuan suara baru ini didukung oleh model text-to-speech baru, yang mampu menghasilkan audio mirip manusia hanya dari teks dan contoh ucapan beberapa detik,” tulis Open AI dalam sebuah posting blog. “Kami berkolaborasi dengan pengisi suara profesional untuk menciptakan setiap suara. Kami juga menggunakan Whisper, sistem pengenalan suara sumber terbuka kami, untuk menyalin kata-kata yang Anda ucapkan ke dalam teks.”

Dengan fitur-fitur baru, pengguna dapat terlibat dalam percakapan bolak-balik ChatGPT menggunakan suara mereka. Mereka juga bisa berdiskusi tentang gambar dengan chatbot. Fitur-fitur tersebut akan diluncurkan dalam dua minggu ke depan untuk pengguna Plus dan Enterprise.

Kemampuan suara akan hadir di iOS dan Android sebagai pilihan sementara fitur gambar akan tersedia di semua platform.

Untuk mulai menggunakan fungsi suara, pengguna dapat menuju ke Pengaturan → Fitur Baru di aplikasi seluler dan memilih “percakapan suara”. Selanjutnya, pengguna harus mengetuk tombol headphone yang terdapat di sudut kanan atas layar beranda dan memilih suara pilihan mereka dari lima pilihan suara berbeda.

Untuk berbicara dengan ChatGPT melalui gambar, pengguna dapat mengetuk tombol foto untuk mengambil gambar atau memilih salah satu. Jika menggunakan iOS atau Android, ketuk tombol plus sebelum melanjutkan. Selain itu, mereka dapat terlibat dalam diskusi dengan banyak gambar atau menggunakannya untuk memandu chatbot.

OpenAI mengatakan bahwa pemahaman gambar didukung oleh multimodal GPT-35 dan. GPT-4. Model-model ini memanfaatkan kemampuan penalaran bahasa untuk menganalisis beragam konten visual, yang mencakup foto, tangkapan layar, dan dokumen yang berisi kombinasi teks dan gambar.

OpenAIkemitraan dengan Spotify

Spotify juga Hari ini mengumumkan fitur terjemahan suara bertenaga AI. Fitur baru ini dapat menerjemahkan podcast ke berbagai bahasa, memanfaatkan suara asli podcaster.

Menurut Verge, fitur terjemahan ini mengandalkan OpenAIAlat transkripsi suara milik Whisper yang mampu mentranskripsikan ucapan bahasa Inggris dan menerjemahkan berbagai bahasa ke dalam bahasa Inggris.

Sebagai bagian dari uji coba, perusahaan telah bekerja sama dengan podcaster Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons, dan Steven Bartlett untuk membuat terjemahan suara berbasis AI dalam bahasa seperti Spanyol, Prancis, dan Jerman untuk episode katalog tertentu dan yang akan datang. rilis.

“Kami percaya bahwa pendekatan AI yang bijaksana dapat membantu membangun hubungan yang lebih dalam antara pendengar dan pencipta, yang merupakan komponen kunci dari misi Spotify untuk membuka potensi kreativitas manusia,” Ziad Sultan, VP Personalisasi Spotify, mengatakan dalam sebuah pernyataan.

Episode terjemahan suara dari pembuat percontohan akan tersedia di seluruh dunia untuk pengguna Premium dan Gratis.

Penolakan tanggung jawab

Sejalan dengan Percayai pedoman Proyek, harap dicatat bahwa informasi yang diberikan pada halaman ini tidak dimaksudkan untuk dan tidak boleh ditafsirkan sebagai nasihat hukum, pajak, investasi, keuangan, atau bentuk nasihat lainnya. Penting untuk hanya menginvestasikan jumlah yang mampu Anda tanggung kerugiannya dan mencari nasihat keuangan independen jika Anda ragu. Untuk informasi lebih lanjut, kami menyarankan untuk merujuk pada syarat dan ketentuan serta halaman bantuan dan dukungan yang disediakan oleh penerbit atau pengiklan. MetaversePost berkomitmen terhadap pelaporan yang akurat dan tidak memihak, namun kondisi pasar dapat berubah tanpa pemberitahuan.

Tentang Penulis

Cindy adalah seorang jurnalis di Metaverse Post, mencakup topik yang terkait dengan web3, NFT, metaverse dan AI, dengan fokus pada wawancara dengan Web3 pelaku industri. Dia telah berbicara dengan lebih dari 30 eksekutif tingkat C dan terus bertambah, menyampaikan wawasan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini tinggal di Tbilisi, Georgia. Beliau meraih gelar Sarjana Komunikasi & Studi Media dari University of South Australia dan memiliki pengalaman satu dekade di bidang jurnalisme dan penulisan. Hubungi dia melalui [email dilindungi] dengan pitches pers, pengumuman dan peluang wawancara.

lebih artikel
Cindy Tan
Cindy Tan

Cindy adalah seorang jurnalis di Metaverse Post, mencakup topik yang terkait dengan web3, NFT, metaverse dan AI, dengan fokus pada wawancara dengan Web3 pelaku industri. Dia telah berbicara dengan lebih dari 30 eksekutif tingkat C dan terus bertambah, menyampaikan wawasan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini tinggal di Tbilisi, Georgia. Beliau meraih gelar Sarjana Komunikasi & Studi Media dari University of South Australia dan memiliki pengalaman satu dekade di bidang jurnalisme dan penulisan. Hubungi dia melalui [email dilindungi] dengan pitches pers, pengumuman dan peluang wawancara.

Dari Ripple hingga DAO Hijau Besar: Bagaimana Proyek Mata Uang Kripto Berkontribusi pada Amal

Mari kita jelajahi inisiatif yang memanfaatkan potensi mata uang digital untuk tujuan amal.

Tahu lebih banyak

AlphaFold 3, Med-Gemini, dan lainnya: Cara AI Mengubah Layanan Kesehatan pada tahun 2024

AI bermanifestasi dalam berbagai cara dalam layanan kesehatan, mulai dari mengungkap korelasi genetik baru hingga memberdayakan sistem bedah robotik ...

Tahu lebih banyak
Bergabunglah dengan Komunitas Teknologi Inovatif Kami
Baca Selengkapnya
Baca lebih lanjut
10 Alat AI Gratis Teratas untuk Pembuatan Konten, Pengeditan Video, dan Lainnya
AI Wiki intisari Pendidikan Gaya Hidup Perangkat lunak Teknologi
10 Alat AI Gratis Teratas untuk Pembuatan Konten, Pengeditan Video, dan Lainnya
14 Mei 2024
Komisi Sekuritas Hong Kong Memperingatkan Penipuan Deepfake yang Menargetkan Industri Kripto: Implikasinya bagi Keamanan Investor
Gaya Hidup Security Wiki Perangkat lunak Cerita dan Ulasan Teknologi
Komisi Sekuritas Hong Kong Memperingatkan Penipuan Deepfake yang Menargetkan Industri Kripto: Implikasinya bagi Keamanan Investor
14 Mei 2024
Ripple Dan Evmos Berkolaborasi Dalam Mengembangkan XRP Ledger EVM Sidechain Dengan Teknologi EvmOS
Bisnis Laporan berita Teknologi
Ripple Dan Evmos Berkolaborasi Dalam Mengembangkan XRP Ledger EVM Sidechain Dengan Teknologi EvmOS
14 Mei 2024
5ireChain Memulai 'Testnet Thunder: GA' yang Berinsentif Untuk Pengujian Stres Jaringan, Mengundang Pengguna Untuk Berpartisipasi Airdrop Hadiah
Laporan berita Teknologi
5ireChain Memulai 'Testnet Thunder: GA' yang Berinsentif Untuk Pengujian Stres Jaringan, Mengundang Pengguna Untuk Berpartisipasi Airdrop Hadiah
14 Mei 2024