Laporan Berita Teknologi
September 25, 2023

OpenAI's ChatGPT Memperkenalkan Naik Taraf Utama, Menambah Perbualan Suara dan Sembang Imej

Secara ringkas

OpenAI akan melancarkan keupayaan suara dan imej baharu ChatGPT dalam tempoh dua minggu akan datang.

Ciri ini hanya akan tersedia kepada pengguna Plus dan Enterprise.

OpenAI hari ini mengumumkan bahawa ia akan melancarkan keupayaan suara dan imej baharu dalam ChatGPT. Ciri baharu ini akan membolehkan pengguna mengadakan perbualan suara dengannya ChatGPT atau berbual dengan chatbot melalui imej.

Pengumuman itu berikutan dakwaan oleh pengguna Reddit yang mendakwa bahawa mereka telah mendapat akses kepada OpenAImodel dan kemudiannya berkongsi maklumat ini pada platform. Redditor FeltSteam menggambarkan model AI dengan nama kerja Arrakis, yang dilaporkan membenarkan pengguna untuk "memasukkan sebarang kombinasi teks, audio dan video."

"Keupayaan suara baharu dikuasakan oleh model teks ke pertuturan baharu, yang mampu menjana audio seperti manusia daripada hanya teks dan beberapa saat contoh ucapan," tulis Open AI dalam sebuah blog post. “Kami bekerjasama dengan pelakon suara profesional untuk mencipta setiap suara. Kami juga menggunakan Whisper, sistem pengecaman pertuturan sumber terbuka kami, untuk menyalin perkataan yang dituturkan anda ke dalam teks."

Dengan ciri baharu, pengguna boleh terlibat dalam perbualan berulang-alik dengan ChatGPT menggunakan suara mereka. Mereka juga boleh membincangkan tentang imej dengan chatbot. Ciri ini akan dilancarkan dalam tempoh dua minggu akan datang kepada pengguna Plus dan Enterprise.

Keupayaan suara akan datang ke iOS dan Android sebagai ikut serta manakala ciri imej akan tersedia pada semua platform.

Untuk mula menggunakan fungsi suara, pengguna boleh menuju ke Tetapan → Ciri Baharu pada apl mudah alih dan memilih "perbualan suara". Seterusnya, pengguna harus mengetik butang fon kepala yang terdapat di penjuru kanan sebelah atas skrin utama dan memilih suara pilihan mereka daripada lima pilihan suara yang berbeza.

Untuk berbual dengan ChatGPT melalui imej, pengguna boleh mengetik butang foto untuk sama ada menangkap imej atau memilih satu. Jika menggunakan iOS atau Android, ketik butang tambah sebelum meneruskan. Selain itu, mereka boleh terlibat dalam perbincangan dengan berbilang imej atau menggunakannya untuk membimbing chatbot.

OpenAI mengatakan bahawa pemahaman imej dikuasakan oleh multimodal GPT-3.5 dan GPT-4. Model ini memanfaatkan kebolehan penaakulan bahasa untuk menganalisis pelbagai kandungan visual, merangkumi gambar, tangkapan skrin dan dokumen yang mengandungi gabungan teks dan imej.

OpenAIperkongsian dengan Spotify

Spotify juga hari ini mengumumkan ciri terjemahan suara dikuasakan AInya. Ciri baharu ini boleh menterjemah podcast ke dalam bahasa yang berbeza, menggunakan suara asal podcaster.

Menurut Ambang The, ciri terjemahan ini bergantung pada OpenAIalat transkripsi suara, Whisper, yang mampu menyalin pertuturan bahasa Inggeris dan menterjemah pelbagai bahasa ke dalam bahasa Inggeris.

Sebagai sebahagian daripada perintis, syarikat itu telah bekerjasama dengan pembuat podcast Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons dan Steven Bartlett untuk mencipta terjemahan suara dipacu AI dalam bahasa seperti Sepanyol, Perancis dan Jerman untuk episod katalog tertentu dan akan datang. keluaran.

"Kami percaya bahawa pendekatan yang bertimbang rasa terhadap AI boleh membantu membina hubungan yang lebih mendalam antara pendengar dan pencipta, komponen utama misi Spotify untuk membuka kunci potensi kreativiti manusia," kata Ziad Sultan, VP Personalization di Spotify, dalam satu kenyataan.

Episod terjemahan suara daripada pencipta perintis akan tersedia di seluruh dunia kepada pengguna Premium dan Percuma.

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Cindy ialah seorang wartawan di Metaverse Post, meliputi topik yang berkaitan dengan web3, NFT, metaverse dan AI, dengan tumpuan pada temu bual dengan Web3 pemain industri. Dia telah bercakap dengan lebih 30 eksekutif peringkat C dan masih lagi, membawa cerapan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini berpangkalan di Tbilisi, Georgia. Beliau memegang ijazah Sarjana Muda dalam Komunikasi & Pengajian Media dari University of South Australia dan mempunyai pengalaman sedekad dalam kewartawanan dan penulisan. Hubungi dia melalui [e-mel dilindungi] dengan padang akhbar, pengumuman dan peluang temu duga.

lebih banyak artikel
Cindy Tan
Cindy Tan

Cindy ialah seorang wartawan di Metaverse Post, meliputi topik yang berkaitan dengan web3, NFT, metaverse dan AI, dengan tumpuan pada temu bual dengan Web3 pemain industri. Dia telah bercakap dengan lebih 30 eksekutif peringkat C dan masih lagi, membawa cerapan berharga mereka kepada pembaca. Berasal dari Singapura, Cindy kini berpangkalan di Tbilisi, Georgia. Beliau memegang ijazah Sarjana Muda dalam Komunikasi & Pengajian Media dari University of South Australia dan mempunyai pengalaman sedekad dalam kewartawanan dan penulisan. Hubungi dia melalui [e-mel dilindungi] dengan padang akhbar, pengumuman dan peluang temu duga.

Dari Ripple kepada The Big Green DAO: Bagaimana Projek Mata Wang Kripto Menyumbang kepada Amal

Mari kita terokai inisiatif yang memanfaatkan potensi mata wang digital untuk tujuan amal.

Mengetahui lebih lanjut

AlphaFold 3, Med-Gemini, dan lain-lain: The Way AI Transforms Healthcare in 2024

AI menjelma dalam pelbagai cara dalam penjagaan kesihatan, daripada mendedahkan korelasi genetik baharu kepada memperkasakan sistem pembedahan robotik ...

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
Dari Ripple kepada The Big Green DAO: Bagaimana Projek Mata Wang Kripto Menyumbang kepada Amal
Analisis Crypto Wiki Perniagaan Pendidikan Gaya hidup pasaran perisian Teknologi
Dari Ripple kepada The Big Green DAO: Bagaimana Projek Mata Wang Kripto Menyumbang kepada Amal
Semoga 13, 2024
AlphaFold 3, Med-Gemini, dan lain-lain: The Way AI Transforms Healthcare in 2024
AI Wiki Analisis Digest Pendapat Perniagaan pasaran Laporan Berita perisian Cerita dan Ulasan Teknologi
AlphaFold 3, Med-Gemini, dan lain-lain: The Way AI Transforms Healthcare in 2024
Semoga 13, 2024
Rangkaian Nim Untuk Melancarkan Rangka Kerja Tokenisasi Pemilikan AI Dan Menjalankan Jualan Hasil Dengan Tarikh Syot Kilat Dijadualkan Untuk Mei
pasaran Laporan Berita Teknologi
Rangkaian Nim Untuk Melancarkan Rangka Kerja Tokenisasi Pemilikan AI Dan Menjalankan Jualan Hasil Dengan Tarikh Syot Kilat Dijadualkan Untuk Mei
Semoga 13, 2024
Binance Bekerjasama dengan Argentina untuk Membanteras Jenayah Siber
Pendapat Perniagaan pasaran Laporan Berita perisian Teknologi
Binance Bekerjasama dengan Argentina untuk Membanteras Jenayah Siber
Semoga 13, 2024