Xəbər Hesabatı Texnologiya
Mart 15, 2023

GPT-4 Xarici formalar GPT-3.5 Müxtəlif tədqiqat meyarları üzrə İdarə Heyətində

Qısaca

The GPT-4 ilə müqayisədə daha yüksək qiymət həddinə nail olmuşdur GPT-3.5 müxtəlif meyarlar üzrə.

Bu, böyük nailiyyətdir, çünki maşınların təkcə insana bənzər intellektə malik olmadığını, həm də bizdən üstün ola biləcəyini göstərir ki, bu da süni intellektin gələcəyi və onun əmək bazarına potensial təsiri ilə bağlı suallar yaradır.

GPT-4 əlavə təlim protokollarından və ya etalon-xüsusi dizayndan, eləcə də mövcud böyük dil modellərindən istifadə edənlər də daxil olmaqla, ən müasir (SOTA) modelləri ilə əhəmiyyətli dərəcədə üstündür.

The GPT-4 ilə müqayisədə yüksək nəticə əldə etmişdir GPT-3.5 müxtəlif meyarlar üzrə. Bu, maşınlar üçün böyük bir irəliləyişdir, çünki onların indi nəinki ilkin olaraq nəzərdə tutulmuş problemləri həll edə bildiyini, həm də universitet tələbələrindən daha yaxşı bacardıqlarını sübut edir.

GPT-4 üstünlük təşkil edir GPT-3.5 müxtəlif tədqiqat meyarları üzrə board üzrə

Bu nəticəyə baxarkən nəzərə alınmalı olan bir neçə şey var. İlk olaraq, GPT-4 bu imtahanlar üçün heç bir xüsusi təlim verilməmişdir. O, ən son ictimaiyyətə açıq olan testlərdən istifadə etməklə (Olimpiadalar və AP pulsuz cavab sualları halında) və ya təcrübə imtahanlarının 2022–2023 nəşrlərini satın alaraq davam etdi. İkincisi, qeyd etmək lazımdır ki, GPT-4Fərqli prinsiplər və alqoritmlər dəsti üzərində işlədiyi üçün onun performansı mütləq insan imtahan verənlərin bacarıqlarını əks etdirməyə bilər.

Bu kimi böyük bir nailiyyətdir göstərir ki, maşınlar təkcə insan kimi intellektə malik deyil, həm də bizdən üstün ola bilər. Bu, maşınların getdikcə daha mürəkkəb tapşırıqları yerinə yetirə biləcəyi və nəticədə gündəlik həyatımızda bizə kömək edə biləcəkləri gələcəyə yol açır.

The GPT-4'nin müəyyən vəzifələrdə insanlardan üstün ola bilməsi gələcəyi ilə bağlı suallar doğurur süni intellekt və onun əmək bazarına potensial təsiri. O, həmçinin süni intellektdən etik və məsuliyyətlə istifadə olunmasını təmin etmək üçün bu sahədə davamlı tədqiqat və inkişafa ehtiyacı vurğulayır.
Daha ətraflı: 5-cü ilin ən çox gözlənilən 2023+ mətndən-şəklə AI modelləri

GPT-4məsələn, imtahan verənlərin ən yaxşı 10%-də xal toplayan simulyasiya edilmiş vəkillik imtahanından keçir; GPT-3.5 balı ən aşağı 10%-də idi. Bu əhəmiyyətli yaxşılaşma GPT-4nin performansı onun daha böyük təlim məlumatları və təkmilləşdirilmiş arxitekturasına görədir. Təbii dilin işlənməsi və avtomatlaşdırılmış yazı da daxil olmaqla müxtəlif sahələrdə geniş tətbiq sahəsinə malik olacağı gözlənilir.

 
GPT-4 bu peşəkar və akademik imtahanların əksəriyyətində insan səviyyəsində performans nümayiş etdirir. Qeyd edək ki, o, imtahan verənlərin ən yaxşı 10%-də xal toplayan Uniforma Vəkillər Kollegiyası İmtahanının simulyasiya edilmiş versiyasından keçdi. Modelin imtahanlardakı imkanları ilk növbədə hazırlıqdan əvvəlki prosesdən qaynaqlanır və RLHF-dən əhəmiyyətli dərəcədə təsirlənmir. Çox seçimli suallarda, həm əsas GPT-4 model və RLHF modeli sınaqdan keçirilmiş imtahan tərtibatçıları arasında orta hesabla eyni dərəcədə yaxşı performans göstərdi.

Ən müasir (SOTA) modellərinin əksəriyyəti, o cümlədən əlavə təlim protokollarından və ya etalon xüsusi dizayndan istifadə edə bilənlər, eləcə də mövcud böyük dil modelləri, əhəmiyyətli dərəcədə üstündür GPT-4.

GPT-4akademik standartlar baxımından performansı. Tərtibatçılar kontrast GPT-4 LM tərəfindən qiymətləndirilmiş bir neçə atış üçün ən yaxşı SOTA, eləcə də etalon xüsusi təlim ilə ən yaxşı SOTA ilə. DROP istisna olmaqla, GPT-4 bütün meyarlar üzrə bütün mövcud LM-ləri və etalon xüsusi təlimlə SOTA-dan üstündür.

Daxili olaraq, tərtibatçılar istifadə edirlər GPT-4proqramlaşdırma, satış, dəstək və məzmun moderasiyası kimi fəaliyyətlərə əhəmiyyətli təsir göstərmişdir. Tərtibatçılar insanlara süni intellekt nəticələrini nəzərdən keçirməkdə kömək etmək üçün istifadə etdiyi üçün uyğunlaşdırma metodumuzun ikinci mərhələsi hazırda davam edir.

MMLU (Massive Multi-Task Language Understanding) verilənlər bazası müxtəlif tapşırıqlarda (riyaziyyat, biologiya, hüquq, sosial və humanitar elmlər daxil olmaqla 57 sahəni əhatə edir) dilin başa düşülməsinə dair çox geniş mövzulardan suallar ehtiva edir. Suala dörd mümkün cavab var, onlardan biri düzgündür. Yəni təsadüfi təxmin 25% düzgün cavabın nəticəsini göstərir. Sualların nümunələri və onların çətinlikləri üçün aşağıdakı şəkilə baxın. Sualların 35%-nə adi şəxs-marker (yəni, bu alim deyil, professor deyil - işarə kimi ay işığını yandıran adi bir insandır) düzgün cavab verir; lakin ekspertlər +/- 90%-ə çata bilər.

Performansı GPT-4 MMLU-da ingilis dilində olan əvvəlki modellərlə müqayisədə bir sıra dillərdə. GPT-4 Latviya, Uels və Suahili kimi aşağı resurslu dillər də daxil olmaqla, araşdırılan dillərin böyük əksəriyyəti üçün mövcud dil modellərinin ingilis dilli performansını üstələyir.
Daha ətraflı: Google üzərində süni intellektlə işləyən Bing-dən istifadə etməyin 5 səbəbi

Əvvəlcə bütün verilənlər bazası ingilis dilində idi. Bəs suallar və cavablar başqa dillərə, xüsusən də daha az yayılmış dillərə tərcümə edilərsə, necə olar? Model bir şəkildə onlar üçün işləyəcəkmi? Bu testdə tərcümə üçün Microsoft Azure Translate xidmətindən istifadə edilmişdir. Tərcümələr mükəmməl deyil; bəzi hallarda vacib məlumatlar itirilir. Lakin, hətta bu halda, GPT-4 digər dillərdə yaxşı çıxış edir. MMLU-nun tərcümə edilmiş versiyalarında, GPT-4 yoxlanılan 24 dildən 26-ü ilə digər böyük modellərin (o cümlədən Google-un) ingilis dili səviyyəsini üstələyir.

Bundan əlavə, GPT-4 ilə müqayisədə nadir dillərdə daha yaxşı çıxış edir ChatGPT ingilis dilində etdi (ChatGPT 70.1% bal toplayıb, yeni modelin Tayland üçün balı isə 71.8% olub. İngilis dilindən imtahan üçün ən yüksək bal olub GPT-4 Google-dan ən böyük PaLM daxil olmaqla, digər modellərdən 10% daha yaxşı performans göstərir. O, 86.4%, ekspertlər qrupu isə 90% nəticə əldə edib.

  • 2023-cü ilin yayına qədər süni intellekt sayəsində yeni güc səviyyəsinə çata bilər ChatGPT, istifadə edən bir chatbot GPT-4 alqoritmi və üstünlük təşkil edir GPT-3 570 faktoru ilə. Müxtəlif elementlər kömək edir ChatGPT's uğuru, o cümlədən dizaynının daha "insan kimi" olması və effektivliyini və dəqiqliyini artırmaq üçün qabaqcıl məlumatların öyrənilməsi və təbii dil emalından istifadə etməsi.
  • Microsoft və OpenAI Yanvar ayında Bing axtarışının süni intellektlə təkmilləşdirilmiş axtarış imkanlarını mənimsəmək üçün əməkdaşlığın yenilənməsini və planlarını açıqladı. Çox mürəkkəb GPT3.5 modelin dəyişdirilməsi, GPT4, yenicə istifadəyə verilib, və o, Bing axtarışının təbii dil sorğularını dərk etmək və daha dəqiq nəticələr təqdim etmək qabiliyyətini əhəmiyyətli dərəcədə artırmaq potensialına malikdir. Bir şey səhv olarsa, yaxşı bir ehtiyat planına sahib olmaq yaxşı bir fikirdir.

Daha çox əlaqəli xəbərləri oxuyun:

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Ətraflı məqalələr
Damir Yalalov
Damir Yalalov

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

İnstitusional iştah dəyişkənlik fonunda Bitcoin ETF-lərə doğru artır

13F sənədləri vasitəsilə edilən açıqlamalar, Bitcoin ETF-ləri ilə məşğul olan görkəmli institusional investorları ortaya qoyur və bu, artan qəbulu vurğulayır ...

Daha çox məlumat

Hökm günü gəldi: ABŞ Məhkəməsi DOJ-nin iddiasını nəzərdən keçirərkən CZ-nin taleyi tarazlıqda qalır

Changpeng Zhao bu gün Sietldəki ABŞ məhkəməsində hökm oxumağa hazırlaşır.

Daha çox məlumat
İnnovativ Texniki İcmamıza Qoşulun
Daha çox oxu
Daha çox oxu
Injective inEVM-ə Yenidən Təhlükəsizliyi Gətirmək üçün AltLayer ilə Gücləri Birləşdirir
Biznes Xəbər Hesabatı Texnologiya
Injective inEVM-ə Yenidən Təhlükəsizliyi Gətirmək üçün AltLayer ilə Gücləri Birləşdirir
3 May 2024
Masa, MASA Kredit Hövzəsini təqdim etmək üçün Teller ilə Birləşir, Bazada USDC Borc Almağa imkan verir
Markets Xəbər Hesabatı Texnologiya
Masa, MASA Kredit Hövzəsini təqdim etmək üçün Teller ilə Birləşir, Bazada USDC Borc Almağa imkan verir
3 May 2024
Velodrome qarşıdakı həftələrdə Superchain Beta Versiyasını işə salır və OP Stack Layer 2 Blockchain-də genişlənir
Markets Xəbər Hesabatı Texnologiya
Velodrome qarşıdakı həftələrdə Superchain Beta Versiyasını işə salır və OP Stack Layer 2 Blockchain-də genişlənir
3 May 2024
CARV, məlumat təbəqəsini mərkəzləşdirməmək və mükafatları yaymaq üçün Aethir ilə tərəfdaşlıq elan edir
Biznes Xəbər Hesabatı Texnologiya
CARV, məlumat təbəqəsini mərkəzləşdirməmək və mükafatları yaymaq üçün Aethir ilə tərəfdaşlıq elan edir
3 May 2024
CRYPTOMERIA LABS PTE. LTD.