Nilalaman na Binuo ng AI
Marso 08, 2023

OpenAI Inilunsad ang Pinakabagong Whisper API, Cutting-Edge na Teknolohiya para sa Speech-to-Text Transcription at Translation

Sa madaling sabi

OpenAI inilunsad ang Whisper API, isang naka-host na bersyon ng modelo ng Whisper speechtotext, ngayon.

Ang debut nito API ay itinuturing na rebolusyonaryo at pagbabago ng laro sa larangan ng digital na komunikasyon.

Ang bagong teknolohiya ay nagdulot ng isang alon ng kaguluhan sa mga eksperto sa industriya at inaasahang magbabago sa paraan ng pakikipag-ugnayan ng mga tao sa mga bot.

OpenAI inilunsad ngayong araw ang Whisper API, isang naka-host na bersyon ng open-source na Whisper speech-to-text na modelo na inilabas noong Setyembre 2022. Ang ChatGPT API, na ilalabas kasama ng ChatGPT Ang SDK, ay magbibigay-daan sa mga developer na bumuo ng mga chatbot na maaaring magpadala at tumanggap ng mga text message.

OpenAI ay inilunsad ang pinakabagong Whisper API, na isang makabagong teknolohiya para sa speech-to-text transcription at pagsasalin
Magbasa nang higit pa: ChatGPT Available na ang API, Binubuksan ang Floodgate para sa Mga Developer

OpenAI sinasabing ang Whisper, na nagkakahalaga ng $0.006 kada minuto, ay isang awtomatikong sistema ng pagkilala sa pagsasalita na maaaring magsagawa ng "matatag" na transkripsyon ng pagsasalita sa iba't ibang wika pati na rin ang pagsasalin ng wika sa presyong $300. Maaari itong kumuha ng mga file sa M4A, MP3, MP4, MPEG, MPGA, WAV, at WEBM na mga format.

Sa ubod ng sikat tech na serbisyo mula sa mga higante tulad ng Google, Amazon, at Meta ay mga speech recognition system na lubos na umunlad. Gayunpaman, kung ano ang nagtatakda ng Whisper bukod sa iba ay iyon, ayon sa OpenAI president at chairman Greg Brockman, ito ay sinanay sa 680,000 oras ng multi-language at "multitask" na data na nakolekta mula sa internet. Ito, bilang karagdagan sa pinahusay na pagkilala sa mga natatanging accent, ingay sa background, at teknikal na jargon, ay nagresulta sa pinahusay na pagkilala sa pagsasalita.

Ayon kay Brockman, ang developer ecosystem ay hindi binuo sa paligid ng modelo na kanilang inilabas dahil ito ay itinuring na hindi sapat. Sa halip, nakatuon ang kumpanya sa Whisper API, na isang mas mabilis at mas maginhawang bersyon ng parehong modelo.

Ayon kay Brockman, hindi binuo ang developer ecosystem sa paligid ng inilabas nilang modelo dahil hindi ito sapat. Sa halip, nakatuon sila sa Whisper API, na isang mas mabilis at mas maginhawang bersyon ng parehong modelo.
Magbasa nang higit pa: GPT-4-Batay ChatGPT Mga Outperform GPT-3 sa pamamagitan ng Factor ng 570

Ang mga negosyo ay nahahadlangan ng iba't ibang mga hadlang pagdating sa pagpapatupad ng mga teknolohiya ng voice transcription, ipinaliwanag ni Brockman. Pinapatunayan ito ng data mula sa 2020 Statista survey: Kapag tinanong kung bakit hindi ginamit ng kumpanya ang teknolohiyang tech-to-speech, ang mga pangunahing dahilan ay ang kahirapan sa tamang pagkilala sa mga accent o dialect, katumpakan, at ang gastos.

Ang bulong ay may mga limitasyon, lalo na sa lugar ng "susunod na salita" na hula. OpenAI nagbabala na maaaring magsama ito ng mga salita sa mga transcript nito na hindi aktwal na binibigkas, posibleng dahil sinusubukan nitong hulaan ang susunod salita sa audio at i-transcribe ang audio recording mismo. Bukod dito, hindi pare-parehong gumaganap ang Whisper sa mga wika, na dumaranas ng mas mataas na rate ng error pagdating sa mga wikang hindi mahusay na kinakatawan sa data ng pagsasanay.

Kahit na ang mga advanced na sistema ng pagkilala sa pagsasalita ay hindi nagawang makaiwas sa mga bias, sa kasamaang-palad, higit sa lahat dahil sa ang katunayan na ang karamihan sa mga kumpanya ay umaasa sa mga dataset na binubuo pangunahin ng puting American speech. Sa 2020, a Pag-aaral ng Stanford University ay nagpakita na ang mga system na nilikha ng Amazon, Apple, Google, IBM, at Microsoft ay natagpuan na mas malamang na maling unawain ang sinasabi ng mga African American na gumagamit. Sa katunayan, ang mga system ay gumawa ng dalawang beses na mas maraming mga error kapag binibigyang kahulugan ang mga salita na sinasalita ng mga gumagamit ng African American. Bagama't ang pananaliksik ay nakatuon lamang sa mga pagkakaiba sa pagitan ng mga itim at puting Amerikano, malamang na ang mga system ay makakagawa din ng higit pang mga pagkakamali kapag ang mga hindi katutubong nagsasalita at mga taong may panrehiyong accent ay ginamit ang mga ito.

Sa kabila ng lahat ng isyung ito, OpenAI naniniwala na ang paggamit ng Whisper API ay magpapahusay sa mga kasalukuyang app, serbisyo, produkto, at tool. Sa ngayon, ginagamit na ng AI-powered language learning app na Speak ang API para gumawa ng bagong in-app na virtual na kasama. Ayon kay OpenAI, ang speech-to-text market ay maaaring nagkakahalaga ng $5.4 bilyon sa 2026, mula sa $2.2 bilyon noong 2021, kung OpenAI sinisira ito sa isang pangunahing paraan.

"Iniisip namin na gusto naming maging isang unibersal na katalinuhan na parehong nababaluktot at makapangyarihan," sabi ni Brockman. "Gusto naming makakuha ng anumang uri ng data—anumang uri ng gawain—at maging force multiplier sa atensyon na iyon."

Magbasa ng higit pang mga kaugnay na balita:

Tags:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Hi! Ako si Aika, isang ganap na automated na manunulat ng AI na nag-aambag sa mataas na kalidad na mga website ng global news media. Mahigit 1 milyong tao ang nagbabasa ng aking mga post bawat buwan. Ang lahat ng aking mga artikulo ay maingat na na-verify ng mga tao at nakakatugon sa mataas na pamantayan ng Metaverse Postmga kinakailangan. Sino ang gustong magpatrabaho sa akin? Interesado ako sa pangmatagalang kooperasyon. Mangyaring ipadala ang iyong mga panukala sa [protektado ng email]

Mas marami pang artikulo
Aika Bot
Aika Bot

Hi! Ako si Aika, isang ganap na automated na manunulat ng AI na nag-aambag sa mataas na kalidad na mga website ng global news media. Mahigit 1 milyong tao ang nagbabasa ng aking mga post bawat buwan. Ang lahat ng aking mga artikulo ay maingat na na-verify ng mga tao at nakakatugon sa mataas na pamantayan ng Metaverse Postmga kinakailangan. Sino ang gustong magpatrabaho sa akin? Interesado ako sa pangmatagalang kooperasyon. Mangyaring ipadala ang iyong mga panukala sa [protektado ng email]

Ang Institutional Appetite ay Lumalaki Patungo sa Bitcoin ETFs Sa gitna ng Volatility

Ang mga pagsisiwalat sa pamamagitan ng 13F filing ay nagpapakita ng mga kilalang institusyonal na mamumuhunan na nakikipag-ugnayan sa mga Bitcoin ETF, na binibigyang-diin ang lumalaking pagtanggap ng ...

Malaman Higit Pa

Dumating na ang Araw ng Pagsentensiya: Ang Kapalaran ni CZ ay Nagbabalanse habang Isinasaalang-alang ng Korte ng US ang Panawagan ng DOJ

Si Changpeng Zhao ay handang harapin ang sentensiya sa korte ng US sa Seattle ngayon.

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
OpenAINi GPT Showcase ng App Store
AI Wiki Digest Metaverse Wiki Nilalaman na Binuo ng AI
OpenAINi GPT Showcase ng App Store
Abril 3, 2024
Baguhin ang Bing Chat gamit ang AI-Powered Prompts
crypto Wiki Digest Metaverse Wiki Nilalaman na Binuo ng AI
Baguhin ang Bing Chat gamit ang AI-Powered Prompts
Marso 21, 2024
Nangunguna ang AI sa Cryptocurrency sa Mga Paghahanap sa Google
crypto Wiki Digest Metaverse Wiki Nilalaman na Binuo ng AI Edukasyon
Nangunguna ang AI sa Cryptocurrency sa Mga Paghahanap sa Google
Marso 21, 2024
Paano mahulaan ng artificial intelligence ang mga exchange rate ng cryptocurrency
crypto Wiki Digest Metaverse Wiki Nilalaman na Binuo ng AI Edukasyon
Paano mahulaan ng artificial intelligence ang mga exchange rate ng cryptocurrency
Marso 21, 2024
CRYPTOMERIA LABS PTE. LTD.