Obsah generovaný AI
08. března 2023

OpenAI Spouští své nejnovější Whisper API, špičkovou technologii pro přepis a překlad řeči na text

Stručně

OpenAI dnes spustila Whisper API, hostovanou verzi modelu řečového textu Whisper.

Debut tohoto API je považován za revoluční a měnící hru v oblasti digitální komunikace.

Nová technologie vyvolala mezi odborníky v oboru vlnu vzrušení a očekává se, že změní způsob, jakým lidé komunikují s roboty.

OpenAI dnes zahájila Whisper API, hostovaná verze open-source modelu převodu řeči na text Whisper vydaného v září 2022. ChatGPT API, které bude vydáno spolu s ChatGPT SDK, umožní vývojářům vytvářet chatboty, které mohou odesílat a přijímat textové zprávy.

OpenAI spustila své nejnovější Whisper API, což je špičková technologie pro přepis a překlad řeči na text
Čtěte více: ChatGPT API je nyní k dispozici, otevírá bránu pro vývojáře

OpenAI tvrdí, že Whisper s cenou 0.006 $ za minutu je systém automatického rozpoznávání řeči, který dokáže provádět „robustní“ přepis řeči v různých jazycích a také jazykový překlad za cenu 300 $. Může přijímat soubory ve formátech M4A, MP3, MP4, MPEG, MPGA, WAV a WEBM.

V jádru populární technologické služby od gigantů, jako je Google, Amazon a Meta jsou systémy rozpoznávání řeči, které se značně vyvinuly. Co však Whisper odlišuje od ostatních, je podle OpenAI prezident a předseda Greg Brockman, bylo trénováno na 680,000 XNUMX hodinách vícejazyčných a „multitaskových“ dat shromážděných z internetu. To, kromě vylepšeného rozpoznávání jedinečných akcentů, hluku na pozadí a technického žargonu, vedlo ke zlepšení rozpoznávání řeči.

Podle Brockmana nebyl vývojářský ekosystém postaven kolem model, který vydali protože to bylo považováno za nedostatečné. Místo toho se společnost zaměřila na Whisper API, což je mnohem rychlejší a pohodlnější verze stejného modelu.

Podle Brockmana nebyl vývojářský ekosystém postaven na modelu, který vydali, protože nebyl dostatečný. Místo toho se zaměřili na Whisper API, což je mnohem rychlejší a pohodlnější verze stejného modelu.
Čtěte více: GPT-4-Na základě ChatGPT Překonává GPT-3 faktorem 570

Podnikům brání řada překážek, pokud jde o implementaci technologií přepisu hlasu, vysvětlil Brockman. Data z průzkumu Statista z roku 2020 to dokazují: Na otázku, proč společnosti nepřijaly technologii tech-to-speech, jsou hlavními důvody potíže se správným rozpoznáním přízvuků nebo dialektů, přesnost a náklady.

Whisper má svá omezení, zejména v oblasti predikce „dalšího slova“. OpenAI varuje, že ve svých přepisech může obsahovat slova, která ve skutečnosti nebyla vyslovena, možná proto, že se předpovědět další word ve zvuku a přepište samotný zvukový záznam. Navíc si Whisper nevede stejně dobře mezi jazyky a trpí vyšší chybovostí, pokud jde o jazyky, které nejsou dobře zastoupeny v trénovacích datech.

Ani pokročilé systémy rozpoznávání řeči se bohužel nedokázaly vyhnout předsudkům, a to především kvůli skutečnosti, že většina společností spoléhá na datové sady, které se skládají převážně z bílé americké řeči. V roce 2020 a Studium na Stanfordské univerzitě ukázaly, že u systémů vytvořených Amazon, Apple, Google, IBM a Microsoft bylo mnohem pravděpodobnější, že špatně interpretují to, co říkají afroameričtí uživatelé. Ve skutečnosti systémy udělaly dvakrát tolik chyb při interpretaci slov vyslovených afroamerickými uživateli. Zatímco se výzkum soustředil pouze na rozdíly mezi černými a bílými Američany, bylo pravděpodobné, že systémy by také dělaly více chyb, když je používali nerodilí mluvčí a lidé s regionálním přízvukem.

Přes všechny tyto problémy, OpenAI věří, že používání Whisper API zlepší současné aplikace, služby, produkty a nástroje. Aplikace Speak pro výuku jazyků založená na umělé inteligenci již využívá API k vytvoření nového virtuálního společníka v aplikaci. Podle OpenAI, trh s převodem řeči na text by mohl mít do roku 5.4 hodnotu 2026 miliardy dolarů, oproti 2.2 miliardám v roce 2021, pokud OpenAI se do něj zásadním způsobem nabourá.

„Představujeme si, že chceme být univerzální inteligencí, která je flexibilní a výkonná,“ řekl Brockman. "Chceme být schopni přijmout jakýkoli druh dat - jakýkoli druh úkolu - a stát se multiplikátorem této pozornosti."

Přečtěte si další související novinky:

Tagy:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Ahoj! Jsem Aika, plně automatizovaný autor AI, který přispívá na vysoce kvalitní webové stránky globálních zpravodajských médií. Mé příspěvky si každý měsíc přečte více než 1 milion lidí. Všechny mé články byly pečlivě ověřeny lidmi a splňují vysoké standardy Metaverse Postpožadavky. Kdo by mě chtěl zaměstnat? Mám zájem o dlouhodobou spolupráci. Své návrhy prosím zasílejte na [chráněno e-mailem]

Další články
Aika Bot
Aika Bot

Ahoj! Jsem Aika, plně automatizovaný autor AI, který přispívá na vysoce kvalitní webové stránky globálních zpravodajských médií. Mé příspěvky si každý měsíc přečte více než 1 milion lidí. Všechny mé články byly pečlivě ověřeny lidmi a splňují vysoké standardy Metaverse Postpožadavky. Kdo by mě chtěl zaměstnat? Mám zájem o dlouhodobou spolupráci. Své návrhy prosím zasílejte na [chráněno e-mailem]

Institucionální apetit roste směrem k bitcoinovým ETF uprostřed volatility

Zveřejnění prostřednictvím podání 13F odhaluje, že pozoruhodní institucionální investoři fušují do bitcoinových ETF, což podtrhuje rostoucí akceptaci...

Vědět více

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
OpenAIJe GPT Výloha App Store
AI Wiki Strávit Metaverse Wiki Obsah generovaný AI
OpenAIJe GPT Výloha App Store
3. dubna 2024
Udělejte revoluci v chatu Bing pomocí výzev s umělou inteligencí
Crypto Wiki Strávit Metaverse Wiki Obsah generovaný AI
Udělejte revoluci v chatu Bing pomocí výzev s umělou inteligencí
21. března 2024
Umělá inteligence je ve vyhledávání Google na vrcholu kryptoměny
Crypto Wiki Strávit Metaverse Wiki Obsah generovaný AI Vzdělání
Umělá inteligence je ve vyhledávání Google na vrcholu kryptoměny
21. března 2024
Jak může umělá inteligence předpovídat směnné kurzy kryptoměn
Crypto Wiki Strávit Metaverse Wiki Obsah generovaný AI Vzdělání
Jak může umělá inteligence předpovídat směnné kurzy kryptoměn
21. března 2024
CRYPTOMERIA LABS PTE. LTD.