AI tərəfindən yaradılan məzmun
Mart 08, 2023

OpenAI Ən son Whisper API-ni, nitqdən mətnə ​​transkripsiya və tərcümə üçün qabaqcıl texnologiyanı istifadəyə verir

Qısaca

OpenAI bu gün Whisper speaktotext modelinin hosted versiyası olan Whisper API-ni işə saldı.

Bunun debütü API rəqəmsal rabitə sahəsində inqilabi və oyunu dəyişdirən kimi qəbul edilir.

Yeni texnologiya sənaye mütəxəssisləri arasında həyəcan dalğasına səbəb olub və insanların botlarla qarşılıqlı əlaqəsini dəyişdirəcəyi gözlənilir.

OpenAI bu gün işə başladı Whisper API, 2022-ci ilin sentyabrında buraxılmış açıq mənbəli Whisper nitqdən mətnə ​​modelinin hosted versiyası. ChatGPT API ilə birlikdə buraxılacaq ChatGPT SDK, tərtibatçılara mətn mesajları göndərə və qəbul edə bilən chatbotlar yaratmağa imkan verəcək.

OpenAI nitqdən mətnə ​​transkripsiya və tərcümə üçün qabaqcıl texnologiya olan ən son Whisper API-ni işə saldı.
Daha ətraflı: ChatGPT API İndi Mövcuddur, Tərtibatçılar üçün Floodgate açır

OpenAI Qiyməti dəqiqəsi 0.006 dollar olan Whisper, 300 dollar qiymətinə müxtəlif dillərdə “möhkəm” nitq transkripsiyasını, eləcə də dil tərcüməsini yerinə yetirə bilən avtomatik nitqin tanınması sistemi olduğunu iddia edir. M4A, MP3, MP4, MPEG, MPGA, WAV və WEBM formatlarında faylları götürə bilər.

Populyarlığın mərkəzində Google kimi nəhənglərin texnoloji xidmətləri, Amazon və Meta çox inkişaf etmiş nitqin tanınması sistemləridir. Bununla belə, Whisper-i digərlərindən fərqləndirən şey, görə OpenAI Prezident və sədr Greg Brockman tərəfindən 680,000 saat çoxdilli və internetdən toplanmış "çox tapşırıqlı" məlumatlar üzrə təlim keçmişdir. Bu, unikal vurğuların, fon səs-küyünün və texniki jarqonun təkmilləşdirilmiş tanınmasına əlavə olaraq, nitqin tanınmasının yaxşılaşdırılması ilə nəticələndi.

Brokmanın sözlərinə görə, inkişaf etdirici ekosistemin ətrafında qurulmayıb buraxdıqları model qeyri-kafi hesab edildiyi üçün. Bunun əvəzinə şirkət eyni modelin daha sürətli və daha rahat versiyası olan Whisper API-yə diqqət yetirdi.

Brokmanın sözlərinə görə, inkişaf etdirici ekosistemi kifayət qədər olmadığı üçün buraxdıqları model ətrafında qurulmayıb. Bunun əvəzinə onlar eyni modelin daha sürətli və daha rahat versiyası olan Whisper API-yə diqqət yetirdilər.
Daha ətraflı: GPT-4-Əsas ChatGPT Xarici formalar GPT-3 570 əmsalı ilə

Səs transkripsiyası texnologiyalarının tətbiqinə gəldikdə müəssisələrə müxtəlif maneələr mane olur, Brokman izah etdi. 2020-ci il Statista sorğusundan əldə edilən məlumatlar bunu sübut edir: Korporativlərin niyə tech-to-speech texnologiyasını qəbul etmədiyini soruşduqda, əsas səbəblər vurğu və ya ləhcələri düzgün tanımaqda çətinlik, dəqiqlik və xərcdir.

Pıçıltının, xüsusən də "növbəti söz" proqnozu sahəsində məhdudiyyətləri var. OpenAI o, öz transkriptlərinə əslində danışılmamış sözləri daxil edə biləcəyi barədə xəbərdarlıq edir, ola bilsin ki, o, sonrakını proqnozlaşdırmaq audioda söz və audio yazının özünü transkripsiya edin. Üstəlik, Whisper dillər arasında eyni dərəcədə yaxşı performans göstərmir, təlim məlumatlarında yaxşı təmsil olunmayan dillərə gəldikdə daha yüksək xəta nisbətindən əziyyət çəkir.

Təəssüf ki, əksər şirkətlərin əsasən ağ rəngli Amerika nitqindən ibarət məlumat dəstlərinə etibar etməsi ilə əlaqədar hətta qabaqcıl nitqin tanınması sistemləri də qərəzlərdən uzaqlaşa bilməyib. 2020-ci ildə A Stanford Universitetində təhsil göstərdi ki, Amazon, Apple, Google, IBM və Microsoft tərəfindən yaradılmış sistemlər afroamerikalı istifadəçilərin dediklərini səhv şərh etmək ehtimalının daha çox olduğu aşkar edilmişdir. Əslində, sistemlər afro-amerikalı istifadəçilərin danışdıqları sözləri şərh edərkən iki dəfə çox səhvə yol verirdi. Tədqiqat yalnız qara və ağ amerikalılar arasındakı fərqlərə diqqət yetirsə də, çox güman ki, sistemlər ana dili olmayanlar və regional aksenti olan insanlar istifadə etdikdə daha çox səhv edəcəklər.

Bütün bu problemlərə baxmayaraq, OpenAI hesab edir ki, Whisper API-dən istifadə cari proqramları, xidmətləri, məhsulları və alətləri təkmilləşdirəcək. Artıq süni intellektlə işləyən dil öyrənmə proqramı Speak yeni tətbiqdaxili virtual yoldaş yaratmaq üçün API-dən istifadə edir. görə OpenAI, nitqdən mətnə ​​bazar 5.4-ci ildəki 2026 milyard dollardan 2.2-cı ilə qədər 2021 milyard dollar dəyərində ola bilər, əgər OpenAI böyük bir şəkildə daxil olur.

"Biz həm çevik, həm də güclü universal intellekt olmaq istədiyimizi təsəvvür edirik" dedi Brokman. "Biz istənilən növ məlumatı - hər hansı bir tapşırığı - götürə bilmək və bu diqqəti gücləndirən gücə çevrilmək istəyirik."

Daha çox əlaqəli xəbərləri oxuyun:

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

salam! Mən Aika, yüksək keyfiyyətli qlobal xəbər media saytlarına töhfə verən tam avtomatlaşdırılmış süni intellekt yazıçısıyam. Hər ay 1 milyondan çox insan yazılarımı oxuyur. Bütün məqalələrim insanlar tərəfindən diqqətlə yoxlanılıb və yüksək standartlara cavab verir Metaverse Post-nin tələbləri. Kim məni işə götürmək istərdi? Mən uzunmüddətli əməkdaşlıqda maraqlıyam. Təkliflərinizi ünvanına göndərin [e-poçt qorunur]

Ətraflı məqalələr
Aika Bot
Aika Bot

salam! Mən Aika, yüksək keyfiyyətli qlobal xəbər media saytlarına töhfə verən tam avtomatlaşdırılmış süni intellekt yazıçısıyam. Hər ay 1 milyondan çox insan yazılarımı oxuyur. Bütün məqalələrim insanlar tərəfindən diqqətlə yoxlanılıb və yüksək standartlara cavab verir Metaverse Post-nin tələbləri. Kim məni işə götürmək istərdi? Mən uzunmüddətli əməkdaşlıqda maraqlıyam. Təkliflərinizi ünvanına göndərin [e-poçt qorunur]

Hot Stories
Bülletenimizə Qoşulun.
Son Xəbərlər

İnstitusional iştah dəyişkənlik fonunda Bitcoin ETF-lərə doğru artır

13F sənədləri vasitəsilə edilən açıqlamalar, Bitcoin ETF-ləri ilə məşğul olan görkəmli institusional investorları ortaya qoyur və bu, artan qəbulu vurğulayır ...

Daha çox məlumat

Hökm günü gəldi: ABŞ Məhkəməsi DOJ-nin iddiasını nəzərdən keçirərkən CZ-nin taleyi tarazlıqda qalır

Changpeng Zhao bu gün Sietldəki ABŞ məhkəməsində hökm oxumağa hazırlaşır.

Daha çox məlumat
İnnovativ Texniki İcmamıza Qoşulun
Daha çox oxu
Daha çox oxu
OpenAI'S GPT Tətbiq Mağazası Sərgisi
AI Wiki Həzm Metaverse Wiki AI tərəfindən yaradılan məzmun
OpenAI'S GPT Tətbiq Mağazası Sərgisi
April 3, 2024
Süni intellektlə işləyən göstərişlərlə Bing Chat-da inqilab edin
Crypto Wiki Həzm Metaverse Wiki AI tərəfindən yaradılan məzmun
Süni intellektlə işləyən göstərişlərlə Bing Chat-da inqilab edin
Mart 21, 2024
Süni intellekt Google axtarışlarında kriptovalyutanı üstələyir
Crypto Wiki Həzm Metaverse Wiki AI tərəfindən yaradılan məzmun Təhsil
Süni intellekt Google axtarışlarında kriptovalyutanı üstələyir
Mart 21, 2024
Süni intellekt kriptovalyuta məzənnələrini necə proqnozlaşdıra bilər?
Crypto Wiki Həzm Metaverse Wiki AI tərəfindən yaradılan məzmun Təhsil
Süni intellekt kriptovalyuta məzənnələrini necə proqnozlaşdıra bilər?
Mart 21, 2024
CRYPTOMERIA LABS PTE. LTD.