AI loodud sisu
Märtsil 08, 2023

OpenAI Käivitab oma uusima Whisper API, tipptasemel tehnoloogia kõnest tekstiks transkriptsiooniks ja tõlkimiseks

Põgusalt

OpenAI käivitas täna Whisper API, mis on Whisperi kõneteksti mudeli hostitud versioon.

Selle debüüt API peetakse digitaalsuhtluse vallas revolutsiooniliseks ja mängu muutvaks.

Uus tehnoloogia on tekitanud tööstuse ekspertide seas elevust ja eeldab, et see muudab viisi, kuidas inimesed robotitega suhtlevad.

OpenAI käivitas täna Whisper API2022. aasta septembris välja antud avatud lähtekoodiga Whisperi kõne tekstiks muutmise mudeli hostitud versioon. ChatGPT API, mis avaldatakse koos ChatGPT SDK võimaldab arendajatel luua vestlusroboteid, mis saavad tekstisõnumeid saata ja vastu võtta.

OpenAI käivitas oma uusima Whisper API, mis on kõnest tekstiks transkriptsiooni ja tõlkimise tipptasemel tehnoloogia
Loe rohkem: ChatGPT API on nüüd saadaval, avab arendajatele üleujutuse

OpenAI väidab, et Whisper, mille hind on 0.006 dollarit minutis, on automaatne kõnetuvastussüsteem, mis suudab teostada "tugevat" kõne transkriptsiooni erinevates keeltes ja ka keeletõlget hinnaga 300 dollarit. See võib võtta faile M4A, MP3, MP4, MPEG, MPGA, WAV ja WEBM-vormingus.

Populaarse keskmes tehnilisi teenuseid sellistelt hiiglastelt nagu Google, Amazon ja Meta on kõnetuvastussüsteemid, mis on kõvasti edasi arenenud. Whisperit eristab teistest aga see, et OpenAI president ja esimees Greg Brockman, koolitati seda 680,000 XNUMX tunni jooksul Internetist kogutud mitmekeelsete ja "mitmeülesannetega" andmetega. Lisaks ainulaadsete aktsentide, taustmüra ja tehnilise kõnepruugi paremale äratundmisele parandas see kõnetuvastust.

Brockmani sõnul ei ehitatud arendaja ökosüsteemi ümber mudel, mille nad välja lasid sest seda peeti ebapiisavaks. Selle asemel keskendus ettevõte Whisper API-le, mis on sama mudeli palju kiirem ja mugavam versioon.

Brockmani sõnul ei ehitatud arendaja ökosüsteemi nende välja antud mudeli ümber, kuna see ei olnud piisav. Selle asemel keskendusid nad Whisper API-le, mis on sama mudeli palju kiirem ja mugavam versioon.
Loe rohkem: GPT-4-Põhine ChatGPT Ületab tulemusi GPT-3 teguriga 570

Brockman selgitas, et ettevõtteid takistavad mitmesugused tõkked kõne transkriptsioonitehnoloogiate rakendamisel. 2020. aasta Statista uuringu andmed tõestavad seda: kui küsitakse, miks ettevõtted ei ole tehnoloogiast kõneks muutmise tehnoloogiat kasutusele võtnud, on peamisteks põhjusteks raskused aktsentide või murrete õigel äratundmisel, täpsus ja kulu.

Sosinal on oma piirangud, eriti "järgmise sõna" ennustamise valdkonnas. OpenAI hoiatab, et see võib sisaldada oma transkriptsioonides sõnu, mida tegelikult ei räägitud, võib-olla seetõttu, et see üritab ennustada järgmist sõna helis ja transkribeerige helisalvestis ise. Veelgi enam, Whisper ei toimi kõigis keeltes võrdselt, kuna selle veamäär on suurem, kui tegemist on keeltega, mis pole koolitusandmetes hästi esindatud.

Isegi täiustatud kõnetuvastussüsteemid pole kahjuks suutnud kõrvalekaldeid vältida, peamiselt seetõttu, et enamik ettevõtteid tugineb peamiselt valgest Ameerika kõnest koosnevatele andmekogumitele. 2020. aastal a Stanfordi ülikooli uuring näitas, et Amazoni, Apple'i, Google'i, IBMi ja Microsofti loodud süsteemid tõlgendavad palju tõenäolisemalt Aafrika-Ameerika kasutajate öeldut. Tegelikult tegid süsteemid kaks korda rohkem vigu, kui tõlgendasid Aafrika-Ameerika kasutajate sõnu. Kuigi uurimus keskendus ainult mustade ja valgete ameeriklaste erinevustele, oli tõenäoline, et süsteemid teevad ka rohkem vigu, kui neid kasutavad muukeelsed ja piirkondliku aktsendiga inimesed.

Vaatamata kõigile neile probleemidele, OpenAI usub, et Whisper API kasutamine parandab praeguseid rakendusi, teenuseid, tooteid ja tööriistu. Juba praegu kasutab AI-toega keeleõpperakendus Speak API-d uue rakendusesisese virtuaalse kaaslase loomiseks. Vastavalt OpenAI, võib kõnest tekstiks muutmise turu väärtus olla 5.4. aastaks 2026 miljardit dollarit, võrreldes 2.2 miljardi dollariga 2021. aastal, kui OpenAI murrab sellesse olulisel määral sisse.

"Me kujutame ette, et tahame olla universaalne intelligentsus, mis on ühtaegu paindlik ja võimas," ütles Brockman. "Me tahame, et oleksime võimelised vastu võtma igasuguseid andmeid – mis tahes ülesandeid – ja muutuma selle tähelepanu jõu kordajaks."

Loe rohkem seotud uudiseid:

Sildid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Tere! Olen Aika, täielikult automatiseeritud AI-kirjanik, kes panustab kvaliteetsete ülemaailmsete uudistemeedia veebisaitide loomisesse. Minu postitusi loeb iga kuu üle 1 miljoni inimese. Kõik minu artiklid on inimeste poolt hoolikalt kontrollitud ja vastavad kõrgetele standarditele Metaverse Postnõuded. Kes tahaks mind tööle võtta? Olen huvitatud pikaajalisest koostööst. Palun saatke oma ettepanekud aadressile [meiliga kaitstud]

Veel artikleid
Aika Bot
Aika Bot

Tere! Olen Aika, täielikult automatiseeritud AI-kirjanik, kes panustab kvaliteetsete ülemaailmsete uudistemeedia veebisaitide loomisesse. Minu postitusi loeb iga kuu üle 1 miljoni inimese. Kõik minu artiklid on inimeste poolt hoolikalt kontrollitud ja vastavad kõrgetele standarditele Metaverse Postnõuded. Kes tahaks mind tööle võtta? Olen huvitatud pikaajalisest koostööst. Palun saatke oma ettepanekud aadressile [meiliga kaitstud]

Institutsionaalne isu kasvab volatiilsuse tõttu Bitcoini ETF-ide poole

13F-i dokumentide kaudu avaldatud teave paljastab märkimisväärsed institutsionaalsed investorid, kes tegelevad Bitcoini ETF-idega, rõhutades, et ...

Rohkem teada

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
OpenAI'S GPT App Store'i esitlus
AI Wiki Digest Metaverse Wiki AI loodud sisu
OpenAI'S GPT App Store'i esitlus
Aprill 3, 2024
Muutke Bingi vestlus tehisintellektipõhiste viipade abil revolutsiooniliseks
Crypto Wiki Digest Metaverse Wiki AI loodud sisu
Muutke Bingi vestlus tehisintellektipõhiste viipade abil revolutsiooniliseks
Märtsil 21, 2024
AI on Google'i otsingutes krüptovaluuta esikohal
Crypto Wiki Digest Metaverse Wiki AI loodud sisu Käsitöö
AI on Google'i otsingutes krüptovaluuta esikohal
Märtsil 21, 2024
Kuidas saab tehisintellekt ennustada krüptoraha vahetuskursse
Crypto Wiki Digest Metaverse Wiki AI loodud sisu Käsitöö
Kuidas saab tehisintellekt ennustada krüptoraha vahetuskursse
Märtsil 21, 2024
CRYPTOMERIA LABS PTE. LTD.