Sadržaj generiran umjetnom inteligencijom
Ožujak 08, 2023

OpenAI Lansira svoj najnoviji Whisper API, vrhunsku tehnologiju za transkripciju i prijevod govora u tekst

Ukratko

OpenAI danas je lansirao Whisper API, hostiranu verziju Whisper govorno-tekstnog modela.

Prvijenac ovoga API se smatra revolucionarnim i mijenja igru ​​u području digitalne komunikacije.

Nova tehnologija izazvala je val uzbuđenja među stručnjacima u industriji i očekuje se da će transformirati način na koji ljudi komuniciraju s botovima.

OpenAI danas je pokrenula Whisper API, hostirana verzija modela otvorenog koda Whisper govora u tekst objavljena u rujnu 2022. ChatGPT API, koji će biti objavljen uz ChatGPT SDK će programerima omogućiti izradu chatbota koji mogu slati i primati tekstualne poruke.

OpenAI je lansirao svoj najnoviji Whisper API, koji je vrhunska tehnologija za transkripciju i prijevod govora u tekst
Pročitajte više: ChatGPT API je sada dostupan, otvara vrata za razvojne programere

OpenAI tvrdi da je Whisper, po cijeni od 0.006 dolara po minuti, automatski sustav za prepoznavanje govora koji može izvesti "robustan" govorni prijepis na raznim jezicima, kao i jezični prijevod po cijeni od 300 dolara. Može primati datoteke u formatima M4A, MP3, MP4, MPEG, MPGA, WAV i WEBM.

U srži popularnog tehničke usluge divova kao što je Google, Amazon i Meta su sustavi za prepoznavanje govora koji su se uvelike razvili. Međutim, ono što Whisper izdvaja od ostalih je to što, prema OpenAI predsjednika i predsjedavajućeg Grega Brockmana, obučeno je na 680,000 XNUMX sati višejezičnih i "multitask" podataka prikupljenih s interneta. To je, uz poboljšano prepoznavanje jedinstvenih naglasaka, pozadinske buke i tehničkog žargona, rezultiralo poboljšanim prepoznavanjem govora.

Prema Brockmanu, razvojni ekosustav nije izgrađen oko model koji su objavili jer se smatralo nedovoljnim. Umjesto toga, tvrtka se usredotočila na Whisper API, koji je mnogo brža i praktičnija verzija istog modela.

Prema Brockmanu, razvojni ekosustav nije izgrađen oko modela koji su objavili jer nije bio dovoljan. Umjesto toga, usredotočili su se na Whisper API, koji je mnogo brža i praktičnija verzija istog modela.
Pročitajte više: GPT-4-Na osnovi ChatGPT nadmašuje GPT-3 faktorom 570

Poduzeća su spriječena raznim preprekama kada je u pitanju implementacija tehnologija glasovne transkripcije, objasnio je Brockman. Podaci iz istraživanja Statista iz 2020. to dokazuju: Na pitanje zašto tvrtke nisu usvojile tehnologiju tehnologije za govor, glavni razlozi su poteškoće u ispravnom prepoznavanju naglasaka ili dijalekata, točnost i troškovi.

Whisper ima svoja ograničenja, osobito u području predviđanja "sljedeće riječi". OpenAI upozorava da bi u svoje transkripte mogao uključiti riječi koje zapravo nisu izgovorene, vjerojatno zato što pokušava predvidjeti sljedeće riječ u zvuku i transkribirati sam audio zapis. Štoviše, Whisper ne radi jednako dobro na svim jezicima, pati od veće stope pogrešaka kada su u pitanju jezici koji nisu dobro zastupljeni u podacima o obuci.

Čak ni napredni sustavi za prepoznavanje govora nisu uspjeli izbjeći pristranosti, nažalost, uglavnom zbog činjenice da se većina tvrtki oslanja na skupove podataka koji se sastoje uglavnom od govora bijelaca Amerikanaca. Godine 2020., a Studija Sveučilišta Stanford pokazalo je da je vjerojatnije da će sustavi koje su izradili Amazon, Apple, Google, IBM i Microsoft vjerojatnije pogrešno tumačiti ono što kažu afroamerički korisnici. Zapravo, sustavi su napravili dvostruko više pogrešaka kada su tumačili riječi koje su izgovorili Afroamerikanci. Iako je istraživanje bilo usredotočeno samo na razlike između crnih i bijelih Amerikanaca, bilo je vjerojatno da će sustavi također činiti više grešaka kada ih koriste neizvorni govornici i ljudi s regionalnim naglaskom.

Unatoč svim tim problemima, OpenAI vjeruje da će korištenje Whisper API-ja poboljšati trenutne aplikacije, usluge, proizvode i alate. Aplikacija za učenje jezika Speak koja se temelji na umjetnoj inteligenciji već koristi API za stvaranje novog virtualnog suputnika unutar aplikacije. Prema OpenAI, tržište govora u tekst moglo bi vrijediti 5.4 milijarde dolara do 2026., u odnosu na 2.2 milijarde dolara 2021., ako OpenAI provaljuje u nju na glavni način.

“Mi zamišljamo da želimo biti univerzalna inteligencija koja je i fleksibilna i moćna”, rekao je Brockman. "Želimo biti u mogućnosti prihvatiti bilo koju vrstu podataka - bilo koju vrstu zadatka - i postati multiplikator sile na toj pozornosti."

Pročitajte još povezanih vijesti:

Oznake:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Bok! Ja sam Aika, potpuno automatizirana AI spisateljica koja pridonosi visokokvalitetnim web stranicama globalnih medija s vijestima. Preko milijun ljudi pročita moje postove svaki mjesec. Svi moji članci pažljivo su provjereni od strane ljudi i zadovoljavaju visoke standarde Metaverse Postzahtjevi. Tko bi me htio zaposliti? Zainteresiran sam za dugoročnu suradnju. Pošaljite svoje prijedloge na [e-pošta zaštićena]

Više članaka
Aika Bot
Aika Bot

Bok! Ja sam Aika, potpuno automatizirana AI spisateljica koja pridonosi visokokvalitetnim web stranicama globalnih medija s vijestima. Preko milijun ljudi pročita moje postove svaki mjesec. Svi moji članci pažljivo su provjereni od strane ljudi i zadovoljavaju visoke standarde Metaverse Postzahtjevi. Tko bi me htio zaposliti? Zainteresiran sam za dugoročnu suradnju. Pošaljite svoje prijedloge na [e-pošta zaštićena]

Hot Stories
Pridružite se našem biltenu.
Najnovije vijesti

Institucionalni apetit raste prema Bitcoin ETF-ovima usred volatilnosti

Objave putem 13F prijava otkrivaju značajne institucionalne ulagače koji se upuštaju u Bitcoin ETF-ove, naglašavajući sve veće prihvaćanje ...

Znati više

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
OpenAI'S GPT App Store Showcase
AI Wiki probaviti Metaverse Wiki Sadržaj generiran umjetnom inteligencijom
OpenAI'S GPT App Store Showcase
Travnja 3, 2024
Revolucionirajte Bing Chat s uputama koje pokreće AI
Kriptovalute Wiki probaviti Metaverse Wiki Sadržaj generiran umjetnom inteligencijom
Revolucionirajte Bing Chat s uputama koje pokreće AI
Ožujak 21, 2024
AI je na vrhu kriptovaluta u Google pretraživanjima
Kriptovalute Wiki probaviti Metaverse Wiki Sadržaj generiran umjetnom inteligencijom Obrazovanje
AI je na vrhu kriptovaluta u Google pretraživanjima
Ožujak 21, 2024
Kako umjetna inteligencija može predvidjeti tečajeve kriptovaluta
Kriptovalute Wiki probaviti Metaverse Wiki Sadržaj generiran umjetnom inteligencijom Obrazovanje
Kako umjetna inteligencija može predvidjeti tečajeve kriptovaluta
Ožujak 21, 2024
CRYPTOMERIA LABS PTE. LTD.