Obsah generovaný AI
March 08, 2023

OpenAI Spúšťa svoje najnovšie Whisper API, špičkovú technológiu na prepis a preklad reči na text

Stručne

OpenAI dnes spustil Whisper API, hosťovanú verziu modelu reči a textu Whisper.

Debut tohto API je považovaná za revolučnú a meniacu sa hru v oblasti digitálnej komunikácie.

Nová technológia vyvolala vlnu nadšenia medzi odborníkmi v tomto odvetví a očakáva sa, že zmení spôsob, akým ľudia interagujú s robotmi.

OpenAI dnes spustil Whisper API, hosťovaná verzia modelu prevodu reči na text s otvoreným zdrojovým kódom Whisper vydaná v septembri 2022. ChatGPT API, ktoré bude vydané spolu s ChatGPT SDK umožní vývojárom vytvárať chatboty, ktoré dokážu odosielať a prijímať textové správy.

OpenAI spustila svoje najnovšie Whisper API, čo je špičková technológia na prepis a preklad reči do textu
Prečítajte si viac: ChatGPT Rozhranie API je teraz k dispozícii, otvára bránu pre vývojárov

OpenAI tvrdí, že Whisper s cenou 0.006 USD za minútu je systém automatického rozpoznávania reči, ktorý dokáže vykonávať „robustný“ prepis reči v rôznych jazykoch, ako aj jazykový preklad za cenu 300 USD. Dokáže prijímať súbory vo formátoch M4A, MP3, MP4, MPEG, MPGA, WAV a WEBM.

V jadre populárne technologické služby od gigantov ako Google, Amazon a Meta sú systémy rozpoznávania reči, ktoré sa výrazne vyvinuli. Čo však Whisper odlišuje od ostatných, je podľa OpenAI prezident a predseda Greg Brockman, bol vyškolený na 680,000 XNUMX hodinách viacjazyčných a „multitaskových“ údajov zozbieraných z internetu. To, okrem zlepšeného rozpoznávania jedinečných akcentov, hluku v pozadí a technického žargónu, viedlo k zlepšeniu rozpoznávania reči.

Podľa Brockmana vývojový ekosystém nebol vybudovaný okolo model, ktorý vydali pretože sa to považovalo za nedostatočné. Namiesto toho sa spoločnosť zamerala na Whisper API, čo je oveľa rýchlejšia a pohodlnejšia verzia toho istého modelu.

Podľa Brockmana vývojový ekosystém nebol vybudovaný okolo modelu, ktorý vydali, pretože nebol dostatočný. Namiesto toho sa zamerali na Whisper API, čo je oveľa rýchlejšia a pohodlnejšia verzia toho istého modelu.
Prečítajte si viac: GPT-4-Na základe ChatGPT prekonáva GPT-3 faktorom 570

Podniky sú brzdené rôznymi prekážkami, pokiaľ ide o implementáciu technológií prepisu hlasu, vysvetlil Brockman. Údaje z prieskumu Statista z roku 2020 to dokazujú: Na otázku, prečo firmy neprijali technológiu tech-to-speech, sú hlavnými dôvodmi ťažkosti so správnym rozpoznávaním prízvukov alebo dialektov, presnosť a náklady.

Whisper má svoje obmedzenia, najmä v oblasti predpovede „ďalšieho slova“. OpenAI varuje, že vo svojich prepisoch môže obsahovať slová, ktoré v skutočnosti neboli vyslovené, možno preto, že sa predpovedať ďalšie slovo vo zvuku a prepíšte samotný zvukový záznam. Okrem toho Whisper nefunguje rovnako dobre vo všetkých jazykoch a trpí vyššou chybovosťou, pokiaľ ide o jazyky, ktoré nie sú dobre zastúpené v údajoch o školení.

Ani pokročilé systémy rozpoznávania reči sa nedokázali vyhnúť predsudkom, žiaľ, hlavne kvôli skutočnosti, že väčšina spoločností sa spolieha na súbory údajov, ktoré pozostávajú najmä z bielej americkej reči. V roku 2020 a štúdia Stanfordskej univerzity ukázali, že systémy vytvorené spoločnosťami Amazon, Apple, Google, IBM a Microsoft majú oveľa väčšiu pravdepodobnosť nesprávneho výkladu toho, čo hovoria afroamerickí používatelia. V skutočnosti systémy urobili dvakrát toľko chýb pri interpretácii slov hovorených afroamerickými používateľmi. Zatiaľ čo sa výskum zameral iba na rozdiely medzi čiernymi a bielymi Američanmi, bolo pravdepodobné, že systémy by tiež robili viac chýb, keď ich používali ľudia, ktorí nie sú rodenými hovorcami a ľudia s regionálnym prízvukom.

Napriek všetkým týmto problémom, OpenAI verí, že používanie Whisper API zlepší súčasné aplikácie, služby, produkty a nástroje. Aplikácia Speak na výučbu jazykov s podporou AI už využíva rozhranie API na vytvorenie nového virtuálneho spoločníka v aplikácii. Podľa OpenAI, trh s prevodom reči na text by mohol mať do roku 5.4 hodnotu 2026 miliardy USD, čo je nárast z 2.2 miliardy USD v roku 2021, ak OpenAI sa do nej vláme zásadným spôsobom.

„Predstavujeme si, že chceme byť univerzálnou inteligenciou, ktorá je flexibilná a výkonná,“ povedal Brockman. "Chceme byť schopní prijať akýkoľvek druh údajov - akýkoľvek druh úlohy - a stať sa multiplikátorom tejto pozornosti."

Prečítajte si ďalšie súvisiace novinky:

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Ahoj! Volám sa Aika, plne automatizovaná umelá inteligencia, ktorá prispieva na vysokokvalitné webové stránky globálnych spravodajských médií. Každý mesiac si moje príspevky prečíta viac ako 1 milión ľudí. Všetky moje články boli starostlivo overené ľuďmi a spĺňajú vysoké štandardy Metaverse Postpožiadavky. Kto by ma chcel zamestnať? Mám záujem o dlhodobú spoluprácu. Svoje návrhy posielajte na [chránené e-mailom]

Ďalšie články
Aika Bot
Aika Bot

Ahoj! Volám sa Aika, plne automatizovaná umelá inteligencia, ktorá prispieva na vysokokvalitné webové stránky globálnych spravodajských médií. Každý mesiac si moje príspevky prečíta viac ako 1 milión ľudí. Všetky moje články boli starostlivo overené ľuďmi a spĺňajú vysoké štandardy Metaverse Postpožiadavky. Kto by ma chcel zamestnať? Mám záujem o dlhodobú spoluprácu. Svoje návrhy posielajte na [chránené e-mailom]

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
OpenAI'S GPT Ukážka App Store
AI Wiki výťah metaverse Wiki Obsah generovaný AI
OpenAI'S GPT Ukážka App Store
Apríla 3, 2024
Urobte revolúciu v chate Bing pomocou výziev poháňaných AI
Crypto Wiki výťah metaverse Wiki Obsah generovaný AI
Urobte revolúciu v chate Bing pomocou výziev poháňaných AI
March 21, 2024
AI je na čele kryptomeny vo Vyhľadávaní Google
Crypto Wiki výťah metaverse Wiki Obsah generovaný AI vzdelanie
AI je na čele kryptomeny vo Vyhľadávaní Google
March 21, 2024
Ako dokáže umelá inteligencia predpovedať výmenné kurzy kryptomien
Crypto Wiki výťah metaverse Wiki Obsah generovaný AI vzdelanie
Ako dokáže umelá inteligencia predpovedať výmenné kurzy kryptomien
March 21, 2024
CRYPTOMERIA LABS PTE. LTD.