OpenAI's ChatGPT Memperkenalkan Naik Taraf Utama, Menambah Perbualan Suara dan Sembang Imej
Secara ringkas
OpenAI akan melancarkan keupayaan suara dan imej baharu ChatGPT dalam tempoh dua minggu akan datang.
Ciri ini hanya akan tersedia kepada pengguna Plus dan Enterprise.
OpenAI hari ini mengumumkan bahawa ia akan melancarkan keupayaan suara dan imej baharu dalam ChatGPT. Ciri baharu ini akan membolehkan pengguna mengadakan perbualan suara dengannya ChatGPT atau berbual dengan chatbot melalui imej.
Pengumuman itu berikutan dakwaan oleh pengguna Reddit yang mendakwa bahawa mereka telah mendapat akses kepada OpenAImodel dan kemudiannya berkongsi maklumat ini pada platform. Redditor FeltSteam menggambarkan model AI dengan nama kerja Arrakis, yang dilaporkan membenarkan pengguna untuk "memasukkan sebarang kombinasi teks, audio dan video."
"Keupayaan suara baharu dikuasakan oleh model teks ke pertuturan baharu, yang mampu menjana audio seperti manusia daripada hanya teks dan beberapa saat contoh ucapan," tulis Open AI dalam sebuah blog post. “Kami bekerjasama dengan pelakon suara profesional untuk mencipta setiap suara. Kami juga menggunakan Whisper, sistem pengecaman pertuturan sumber terbuka kami, untuk menyalin perkataan yang dituturkan anda ke dalam teks."
Saya menemui beberapa spekulasi pelik yang belum disahkan tentang model dalaman yang berkuasa di Reddit.
— Yam Peleg (@Yampeleg) September 25, 2023
– Sila ambil semua dengan sebutir garam. –
Rupa-rupanya,
Dua pengguna berbeza mendakwa mereka mendapat akses kepada OpenAImodel dalaman dan sedang berkongsi maklumat tentang reddit.
FeltSteam… pic.twitter.com/JRJH4xADZX
Dengan ciri baharu, pengguna boleh terlibat dalam perbualan berulang-alik dengan ChatGPT menggunakan suara mereka. Mereka juga boleh membincangkan tentang imej dengan chatbot. Ciri ini akan dilancarkan dalam tempoh dua minggu akan datang kepada pengguna Plus dan Enterprise.
Keupayaan suara akan datang ke iOS dan Android sebagai ikut serta manakala ciri imej akan tersedia pada semua platform.
Untuk mula menggunakan fungsi suara, pengguna boleh menuju ke Tetapan → Ciri Baharu pada apl mudah alih dan memilih "perbualan suara". Seterusnya, pengguna harus mengetik butang fon kepala yang terdapat di penjuru kanan sebelah atas skrin utama dan memilih suara pilihan mereka daripada lima pilihan suara yang berbeza.
Untuk berbual dengan ChatGPT melalui imej, pengguna boleh mengetik butang foto untuk sama ada menangkap imej atau memilih satu. Jika menggunakan iOS atau Android, ketik butang tambah sebelum meneruskan. Selain itu, mereka boleh terlibat dalam perbincangan dengan berbilang imej atau menggunakannya untuk membimbing chatbot.
OpenAI mengatakan bahawa pemahaman imej dikuasakan oleh multimodal GPT-3.5 dan GPT-4. Model ini memanfaatkan kebolehan penaakulan bahasa untuk menganalisis pelbagai kandungan visual, merangkumi gambar, tangkapan skrin dan dokumen yang mengandungi gabungan teks dan imej.
OpenAIperkongsian dengan Spotify
Spotify juga hari ini mengumumkan ciri terjemahan suara dikuasakan AInya. Ciri baharu ini boleh menterjemah podcast ke dalam bahasa yang berbeza, menggunakan suara asal podcaster.
Menurut Ambang The, ciri terjemahan ini bergantung pada OpenAIalat transkripsi suara, Whisper, yang mampu menyalin pertuturan bahasa Inggeris dan menterjemah pelbagai bahasa ke dalam bahasa Inggeris.
Sebagai sebahagian daripada perintis, syarikat itu telah bekerjasama dengan pembuat podcast Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons dan Steven Bartlett untuk mencipta terjemahan suara dipacu AI dalam bahasa seperti Sepanyol, Perancis dan Jerman untuk episod katalog tertentu dan akan datang. keluaran.
"Kami percaya bahawa pendekatan yang bertimbang rasa terhadap AI boleh membantu membina hubungan yang lebih mendalam antara pendengar dan pencipta, komponen utama misi Spotify untuk membuka kunci potensi kreativiti manusia," kata Ziad Sultan, VP Personalization di Spotify, dalam satu kenyataan.
Episod terjemahan suara daripada pencipta perintis akan tersedia di seluruh dunia kepada pengguna Premium dan Percuma.
Penafian
Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.
Tentang Pengarang
Cindy ialah seorang wartawan di Metaverse Post, meliputi topik yang berkaitan dengan web3, NFT, metaverse dan AI, dengan tumpuan pada temu bual dengan Web3 pemain industri. Dia telah bercakap dengan lebih 30 eksekutif peringkat C dan masih lagi, membawa cerapan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini berpangkalan di Tbilisi, Georgia. Beliau memegang ijazah Sarjana Muda dalam Komunikasi & Pengajian Media dari University of South Australia dan mempunyai pengalaman sedekad dalam kewartawanan dan penulisan. Hubungi dia melalui [e-mel dilindungi] dengan padang akhbar, pengumuman dan peluang temu duga.
lebih banyak artikelCindy ialah seorang wartawan di Metaverse Post, meliputi topik yang berkaitan dengan web3, NFT, metaverse dan AI, dengan tumpuan pada temu bual dengan Web3 pemain industri. Dia telah bercakap dengan lebih 30 eksekutif peringkat C dan masih lagi, membawa cerapan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini berpangkalan di Tbilisi, Georgia. Beliau memegang ijazah Sarjana Muda dalam Komunikasi & Pengajian Media dari University of South Australia dan mempunyai pengalaman sedekad dalam kewartawanan dan penulisan. Hubungi dia melalui [e-mel dilindungi] dengan padang akhbar, pengumuman dan peluang temu duga.