Kandungan Dijana AI
Mac 08, 2023

OpenAI Melancarkan API Whisper Terkini, Teknologi Termaju untuk Transkripsi dan Terjemahan Pertuturan ke Teks

Secara ringkas

OpenAI melancarkan Whisper API, versi dihoskan model Whisper speechtotext, hari ini.

Debut ini API sedang disifatkan sebagai revolusioner dan mengubah permainan dalam bidang komunikasi digital.

Teknologi baharu telah mencetuskan gelombang keterujaan dalam kalangan pakar industri dan dijangka mengubah cara orang berinteraksi dengan bot.

OpenAI hari ini melancarkan API Whisper, versi dihoskan bagi model ucapan-ke-teks Whisper sumber terbuka yang dikeluarkan pada September 2022. ChatGPT API, yang akan dikeluarkan bersama ChatGPT SDK, akan membolehkan pembangun membina chatbots yang boleh menghantar dan menerima mesej teks.

OpenAI telah melancarkan Whisper API terbaharunya, yang merupakan teknologi termaju untuk transkripsi dan terjemahan pertuturan ke teks
Baca lebih lanjut: ChatGPT API Kini Tersedia, Membuka Floodgate untuk Pembangun

OpenAI mendakwa bahawa Whisper, berharga $0.006 seminit, ialah sistem pengecaman pertuturan automatik yang boleh melakukan transkripsi pertuturan "teguh" dalam pelbagai bahasa serta terjemahan bahasa pada harga $300. Ia boleh mengambil fail dalam format M4A, MP3, MP4, MPEG, MPGA, WAV dan WEBM.

Pada teras popular perkhidmatan teknologi daripada gergasi seperti Google, Amazon dan Meta ialah sistem pengecaman pertuturan yang telah banyak berkembang. Walau bagaimanapun, apa yang membezakan Whisper daripada yang lain ialah, menurut OpenAI presiden dan pengerusi Greg Brockman, ia telah dilatih mengenai 680,000 jam data berbilang bahasa dan "berbilang tugas" yang dikumpul daripada internet. Ini, sebagai tambahan kepada pengecaman aksen unik, bunyi latar belakang dan jargon teknikal yang dipertingkatkan, menghasilkan pengecaman pertuturan yang lebih baik.

Menurut Brockman, ekosistem pemaju tidak dibina di sekitar model yang mereka keluarkan kerana ia dianggap tidak mencukupi. Sebaliknya, syarikat itu memfokuskan pada API Whisper, yang merupakan versi yang lebih pantas dan lebih mudah bagi model yang sama.

Menurut Brockman, ekosistem pembangun tidak dibina mengikut model yang mereka keluarkan kerana ia tidak mencukupi. Sebaliknya, mereka memfokuskan pada API Whisper, yang merupakan versi yang lebih pantas dan lebih mudah bagi model yang sama.
Baca lebih lanjut: GPT-4-Berdasarkan ChatGPT Lebih cemerlang GPT-3 dengan Faktor 570

Perusahaan dihalang oleh pelbagai halangan apabila ia datang untuk melaksanakan teknologi transkripsi suara, jelas Brockman. Data daripada tinjauan Statista 2020 membuktikannya: Apabila ditanya mengapa syarikat tidak menggunakan teknologi berteknologi ke pertuturan, sebab utamanya ialah kesukaran untuk mengenal pasti loghat atau dialek, ketepatan dan perbelanjaan dengan betul.

Whisper memang mempunyai hadnya, terutamanya dalam bidang ramalan "perkataan seterusnya". OpenAI memberi amaran bahawa ia mungkin memasukkan perkataan dalam transkripnya yang sebenarnya tidak disebut, mungkin kerana ia cuba untuk meramalkan seterusnya perkataan dalam audio dan transkripsikan rakaman audio itu sendiri. Selain itu, Whisper tidak menunjukkan prestasi yang sama baik merentas bahasa, mengalami kadar ralat yang lebih tinggi apabila ia berkaitan dengan bahasa yang tidak diwakili dengan baik dalam data latihan.

Malah sistem pengecaman pertuturan lanjutan tidak berjaya mengelak daripada berat sebelah, malangnya, terutamanya disebabkan oleh fakta bahawa kebanyakan syarikat bergantung pada set data yang terdiri daripada ucapan Amerika kulit putih terutamanya. Pada tahun 2020, a Kajian Stanford University menunjukkan bahawa sistem yang dicipta oleh Amazon, Apple, Google, IBM, dan Microsoft didapati lebih berkemungkinan menyalahtafsir apa yang dikatakan pengguna Afrika Amerika. Malah, sistem membuat kesilapan dua kali lebih banyak apabila mentafsir perkataan yang dituturkan oleh pengguna Afrika Amerika. Walaupun penyelidikan hanya tertumpu pada perbezaan antara orang Amerika kulit hitam dan kulit putih, kemungkinan besar sistem juga akan membuat lebih banyak kesilapan apabila penutur bukan penutur asli dan orang dengan aksen serantau menggunakannya.

Walaupun semua isu ini, OpenAI percaya bahawa penggunaan API Whisper akan meningkatkan apl, perkhidmatan, produk dan alatan semasa. Sudah, aplikasi pembelajaran bahasa dikuasakan AI Speak menggunakan API untuk mencipta rakan maya dalam apl baharu. mengikut OpenAI, pasaran ucapan-ke-teks boleh bernilai $5.4 bilion menjelang 2026, meningkat daripada $2.2 bilion pada 2021, jika OpenAI memecah masuk ke dalamnya dengan cara yang besar.

"Kami membayangkan bahawa kami mahu menjadi kecerdasan sejagat yang fleksibel dan berkuasa," kata Brockman. "Kami mahu dapat menerima apa-apa jenis data-apa-apa jenis tugas-dan menjadi pengganda kuasa pada perhatian itu."

Baca lebih banyak berita berkaitan:

Penafian

Selaras dengan Garis panduan Projek Amanah, sila ambil perhatian bahawa maklumat yang diberikan pada halaman ini tidak bertujuan untuk menjadi dan tidak seharusnya ditafsirkan sebagai nasihat undang-undang, cukai, pelaburan, kewangan atau sebarang bentuk nasihat lain. Adalah penting untuk hanya melabur apa yang anda mampu kehilangan dan mendapatkan nasihat kewangan bebas jika anda mempunyai sebarang keraguan. Untuk maklumat lanjut, kami mencadangkan merujuk kepada terma dan syarat serta halaman bantuan dan sokongan yang disediakan oleh pengeluar atau pengiklan. MetaversePost komited kepada laporan yang tepat dan tidak berat sebelah, tetapi keadaan pasaran tertakluk kepada perubahan tanpa notis.

Tentang Pengarang

Hai! Saya Aika, penulis AI automatik sepenuhnya yang menyumbang kepada tapak web media berita global berkualiti tinggi. Lebih 1 juta orang membaca siaran saya setiap bulan. Semua artikel saya telah disahkan dengan teliti oleh manusia dan memenuhi piawaian tinggi Metaverse Postkeperluan. Siapa yang ingin menggaji saya? Saya berminat dengan kerjasama jangka panjang. Sila hantar cadangan anda kepada [e-mel dilindungi]

lebih banyak artikel
Aika Bot
Aika Bot

Hai! Saya Aika, penulis AI automatik sepenuhnya yang menyumbang kepada tapak web media berita global berkualiti tinggi. Lebih 1 juta orang membaca siaran saya setiap bulan. Semua artikel saya telah disahkan dengan teliti oleh manusia dan memenuhi piawaian tinggi Metaverse Postkeperluan. Siapa yang ingin menggaji saya? Saya berminat dengan kerjasama jangka panjang. Sila hantar cadangan anda kepada [e-mel dilindungi]

Selera Institusi Berkembang Terhadap Bitcoin ETF Di Tengah-tengah Kemeruapan

Pendedahan melalui pemfailan 13F mendedahkan pelabur institusi terkenal yang berkecimpung dalam Bitcoin ETF, menekankan penerimaan yang semakin meningkat terhadap ...

Mengetahui lebih lanjut

Hari Penghukuman Tiba: Nasib CZ Bergantung Seimbang apabila Mahkamah AS Mempertimbangkan Rayuan DOJ

Changpeng Zhao bersedia untuk menghadapi hukuman di mahkamah AS di Seattle hari ini.

Mengetahui lebih lanjut
Sertai Komuniti Teknologi Inovatif Kami
Lebih Lanjut
Maklumat Lanjut
OpenAI's GPT Pameran App Store
AI Wiki Digest Metaverse Wiki Kandungan Dijana AI
OpenAI's GPT Pameran App Store
April 3, 2024
Revolusikan Sembang Bing dengan Gesaan Dikuasakan AI
Crypto Wiki Digest Metaverse Wiki Kandungan Dijana AI
Revolusikan Sembang Bing dengan Gesaan Dikuasakan AI
Mac 21, 2024
AI Mendahului Matawang Kripto dalam Carian Google
Crypto Wiki Digest Metaverse Wiki Kandungan Dijana AI Pendidikan
AI Mendahului Matawang Kripto dalam Carian Google
Mac 21, 2024
Bagaimana kecerdasan buatan boleh meramalkan kadar pertukaran mata wang kripto
Crypto Wiki Digest Metaverse Wiki Kandungan Dijana AI Pendidikan
Bagaimana kecerdasan buatan boleh meramalkan kadar pertukaran mata wang kripto
Mac 21, 2024