Yangiliklar hisoboti texnologiya
Mart 15, 2023

GPT-4 Tashqi ko'rinish GPT-3.5 Turli tadqiqot mezonlari bo'yicha kengash bo'ylab

Qisqacha

The GPT-4 dan yuqori baho chegarasiga erishdi GPT-3Turli ko'rsatkichlar bo'yicha .5.

Bu katta yutuqdir, chunki u mashinalar nafaqat insonga o'xshash intellektga qodir, balki bizdan ham o'zib ketishi mumkinligini ko'rsatadi, bu esa AIning kelajagi va uning mehnat bozoriga potentsial ta'siri haqida savollar tug'diradi.

GPT-4 eng zamonaviy (SOTA) modellari, jumladan, qo'shimcha o'quv protokollari yoki benchmark-maxsus dizayndan foydalanadigan modellar, shuningdek, mavjud katta til modellari tomonidan sezilarli darajada ustundir.

The GPT-4 nisbatan yuqori ko‘rsatkichlarga erishdi GPT-3Turli ko'rsatkichlar bo'yicha .5. Bu mashinalar uchun katta yutuqdir, chunki ular endilikda nafaqat dastlab ishlab chiqilgan muammolarni hal qila olishini, balki uni universitet talabalaridan ham yaxshiroq hal qila olishini isbotlaydi.

GPT-4 ustunlik qiladi GPT-3.5 turli tadqiqot mezonlari bo'yicha

Ushbu natijani ko'rib chiqishda e'tiborga olish kerak bo'lgan bir nechta narsa bor. Birinchidan, GPT-4 bu imtihonlar uchun maxsus trening berilmagan. U eng so'nggi ommaga ochiq testlardan (Olimpiadalar va AP bepul javob savollari misolida) foydalanish yoki amaliyot imtihonlarining 2022–2023 nashrlarini sotib olish orqali davom etdi. Ikkinchidan, shuni ta'kidlash kerakki GPT-4ning ishlashi test topshiruvchilarning qobiliyatlarini aks ettirishi shart emas, chunki u boshqa printsiplar va algoritmlar to'plamida ishlaydi.

Bu kabi katta yutuq ko'rsatadi mashinalar nafaqat insonga o'xshash aqlga qodir, balki bizdan ham ustun bo'lishi mumkin. Bu mashinalar tobora murakkab vazifalarni bajarishi mumkin bo'lgan kelajakka yo'l ochadi va oxir-oqibat ular bizga kundalik hayotimizda yordam beradigan kelajakka olib keladi.

The GPT-4Muayyan vazifalarni bajarishda odamlardan ustun bo'lish qobiliyati kelajak haqida savollar tug'diradi sun'iy intellekt va uning mehnat bozoriga potentsial ta'siri. Shuningdek, u AIdan axloqiy va mas'uliyat bilan foydalanishni ta'minlash uchun ushbu sohada doimiy tadqiqot va ishlanmalar zarurligini ta'kidlaydi.
Ko'proq o'qing: 5-yilda 2023+ eng kutilgan matndan tasvirga AI modellari

GPT-4, masalan, imtihon topshiruvchilarning eng yaxshi 10% ball bilan simulyatsiya qilingan bar imtihonidan o'tadi; GPT-3.5 ball eng quyi 10% edi. Bu sezilarli yaxshilanish GPT-4ning ishlashi uning kattaroq o'quv ma'lumotlari va yaxshilangan arxitekturasi bilan bog'liq. Turli sohalarda, jumladan, tabiiy tilni qayta ishlash va avtomatlashtirilgan yozishda keng ko'lamli ilovalar bo'lishi kutilmoqda.

 
GPT-4 ushbu professional va akademik imtihonlarning aksariyatida inson darajasidagi ko'rsatkichlarni namoyish etadi. Ta'kidlash joizki, u imtihon topshiruvchilarning eng yaxshi 10 foizida ball to'plagan yagona advokatlik imtihonining simulyatsiya qilingan versiyasidan o'tdi. Modelning imtihonlardagi imkoniyatlari, birinchi navbatda, tayyorgarlikdan oldingi jarayondan kelib chiqadi va RLHF sezilarli darajada ta'sir qilmaydi. Ko'p tanlovli savollar bo'yicha, ikkalasi ham asos GPT-4 model va RLHF modeli sinovdan o'tgan imtihon ishlab chiquvchilari bo'ylab o'rtacha bir xil darajada yaxshi ishladi.

Ko'pgina zamonaviy (SOTA) modellari, shu jumladan qo'shimcha o'quv protokollari yoki benchmark-maxsus dizayndan foydalanishi mumkin bo'lganlar, shuningdek, mavjud katta til modellaridan sezilarli darajada oshib ketgan GPT-4.

GPT-4ning akademik standartlar bo'yicha ishlashi. Ishlab chiquvchilar kontrast GPT-4 LM tomonidan baholangan bir necha zarba uchun eng yaxshi SOTA, shuningdek, benchmark-maxsus treningga ega eng yaxshi SOTA bilan. DROPdan tashqari, GPT-4 barcha ko'rsatkichlar va SOTA bo'yicha barcha joriy LM'lardan ko'ra maxsus treninglar bilan ustunlik qiladi.

Ichkarida ishlab chiquvchilar undan foydalanishgan GPT-4, bu dasturlash, sotish, qo'llab-quvvatlash va kontentni moderatsiya qilish kabi faoliyatga sezilarli ta'sir ko'rsatdi. Bizning moslashtirish usulimizning ikkinchi bosqichi hozirda davom etmoqda, chunki ishlab chiquvchilar undan AI natijalarini ko'rib chiqishda odamlarga yordam berish uchun foydalanadilar.

MMLU (Massive Multi-Task Language Understanding) maʼlumotlar toʻplami turli vazifalarda (57 ta sohani, jumladan, matematika, biologiya, huquq, ijtimoiy va gumanitar fanlar va boshqalarni qamrab olgan) tilni tushunish boʻyicha juda keng mavzulardagi savollarni oʻz ichiga oladi. Savolga to'rtta javob berish mumkin, ulardan biri to'g'ri. Ya'ni, tasodifiy taxminlar 25% to'g'ri javoblar natijasini ko'rsatadi. Savollar va ularning qiyinchiliklariga misollar uchun quyidagi rasmga qarang. O'rtacha shaxs-marker (ya'ni, bu olim emas, professor emas - belgi sifatida oy nurini ko'rsatadigan oddiy odam) savollarning 35 foiziga to'g'ri javob beradi; Biroq, mutaxassislar +/- 90% ballga erishishlari mumkin.

Ishlash GPT-4 MMLU da ingliz tilidagi oldingi modellarga nisbatan bir qator tillarda. GPT-4 koʻrib chiqilayotgan tillarning katta qismi, jumladan, latviyalik, uels va suahili kabi kam resursli tillar uchun mavjud til modellarining ingliz tilidagi ishlashidan oshib ketadi.
Ko'proq o'qing: Google orqali sun'iy intellektga asoslangan Bing-dan foydalanishning 5 sababi

Dastlab, butun ma'lumotlar to'plami ingliz tilida edi. Ammo savollar va javoblar boshqa tillarga, ayniqsa kamroq tarqalgan tillarga tarjima qilinsa-chi? Model ular uchun qandaydir tarzda ishlaydi? Ushbu testda tarjima qilish uchun Microsoft Azure Translate xizmatidan foydalanilgan. Tarjimalar mukammal emas; ba'zi hollarda muhim ma'lumotlar yo'qoladi. Biroq, bu holatda ham, GPT-4 boshqa tillarda yaxshi ishlaydi. MMLU ning tarjima qilingan versiyalarida, GPT-4 boshqa yirik modellarning (shu jumladan Google’ning) ingliz tili darajasini tekshirilgan 24 ta tildan 26 tasida ortda qoldiradi.

Bundan tashqari, GPT-4 kamdan-kam tillarda yaxshiroq ishlaydi ChatGPT Ingliz tilida qildim (ChatGPT 70.1% ballga erishgan bo'lsa, Tailand uchun yangi modelning balli 71.8% ni tashkil etdi. Ingliz tilidan test uchun ball eng yuqori bo'ldi, bilan GPT-4 boshqa modellarga qaraganda 10% yaxshi ishlaydi, shu jumladan Google'dan eng katta PaLM. U 86.4%, ekspertlar guruhi esa 90% ball oldi.

  • 2023 yilning yoziga kelib, sun'iy intellekt tufayli yangi quvvat darajasiga erishgan bo'lishi mumkin ChatGPTdan foydalanadigan chatbot GPT-4 algoritm va ustunlik qiladi GPT-3 570 marta. Turli elementlar hissa qo'shadi ChatGPTning muvaffaqiyati, jumladan uning dizayni ko'proq "odamga o'xshash" bo'lishi va uning samaradorligi va aniqligini oshirish uchun ma'lumotlarni to'plash va tabiiy tilni qayta ishlashning ilg'or usullaridan foydalanish.
  • Microsoft va OpenAI Yanvar oyida hamkorlikni yangilash va Bing qidiruvi AI tomonidan kengaytirilgan qidirish imkoniyatlarini o'zlashtirish rejalarini e'lon qildi. Juda murakkab GPT3.5 modelni almashtirish, GPT4, endigina ishga tushirildi, va u tabiiy til so'rovlarini tushunish va aniqroq natijalarni taqdim etish uchun Bing qidiruvining imkoniyatlarini sezilarli darajada oshirish imkoniyatiga ega. Agar biror narsa noto'g'ri bo'lsa, yaxshi zaxira rejasiga ega bo'lish yaxshi fikr.

Batafsil tegishli yangiliklarni o'qing:

Masʼuliyatdan voz kechish

Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.

Muallif haqida

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Boshqa maqolalar
Damir Yalolov
Damir Yalolov

Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi. 

Institutsional ishtaha o'zgaruvchanlik sharoitida Bitcoin ETFlariga nisbatan o'sib bormoqda

13F arizalari orqali oshkor qilish Bitcoin ETFs bilan shug'ullanadigan taniqli institutsional investorlarni ochib beradi, bu esa tobora ortib borayotgan qabul qilinishini ta'kidlaydi ...

Ko'proq ma'lumot oling

Hukm chiqarish kuni keldi: AQSh sudi DOJning iltimosini ko'rib chiqayotgani sababli CZ taqdiri muvozanatda.

Changpeng Chjao bugun AQShning Sietldagi sudida hukm chiqarilishiga tayyor.

Ko'proq ma'lumot oling
Innovatsion texnologiyalar hamjamiyatimizga qo'shiling
Ko'proq o'qing
Ko'proq o'qing
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
ish Yangiliklar hisoboti texnologiya
Injective inEVM-ga qayta tiklash xavfsizligini olib kelish uchun AltLayer bilan kuchlarni birlashtiradi
, 3 2024 mumkin
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
Birja Yangiliklar hisoboti texnologiya
Masa, MASA kreditlash pulini joriy qilish uchun kassa bilan hamkorlik qiladi, USDC asosida qarz olishga imkon beradi
, 3 2024 mumkin
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
Birja Yangiliklar hisoboti texnologiya
Velodrome kelgusi haftalarda Superchain beta-versiyasini ishga tushiradi va OP Stack Layer 2 blokcheynlarida kengayadi
, 3 2024 mumkin
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
ish Yangiliklar hisoboti texnologiya
CARV o'zining ma'lumotlar qatlamini markazsizlashtirish va mukofotlarni tarqatish uchun Aethir bilan hamkorlikni e'lon qiladi
, 3 2024 mumkin
CRYPTOMERIA LABS PTE. LTD.