GPT-4 Tashqi ko'rinish GPT-3.5 Turli tadqiqot mezonlari bo'yicha kengash bo'ylab
Qisqacha
The GPT-4 dan yuqori baho chegarasiga erishdi GPT-3Turli ko'rsatkichlar bo'yicha .5.
Bu katta yutuqdir, chunki u mashinalar nafaqat insonga o'xshash intellektga qodir, balki bizdan ham o'zib ketishi mumkinligini ko'rsatadi, bu esa AIning kelajagi va uning mehnat bozoriga potentsial ta'siri haqida savollar tug'diradi.
GPT-4 eng zamonaviy (SOTA) modellari, jumladan, qo'shimcha o'quv protokollari yoki benchmark-maxsus dizayndan foydalanadigan modellar, shuningdek, mavjud katta til modellari tomonidan sezilarli darajada ustundir.
The GPT-4 nisbatan yuqori ko‘rsatkichlarga erishdi GPT-3Turli ko'rsatkichlar bo'yicha .5. Bu mashinalar uchun katta yutuqdir, chunki ular endilikda nafaqat dastlab ishlab chiqilgan muammolarni hal qila olishini, balki uni universitet talabalaridan ham yaxshiroq hal qila olishini isbotlaydi.
Ushbu natijani ko'rib chiqishda e'tiborga olish kerak bo'lgan bir nechta narsa bor. Birinchidan, GPT-4 bu imtihonlar uchun maxsus trening berilmagan. U eng so'nggi ommaga ochiq testlardan (Olimpiadalar va AP bepul javob savollari misolida) foydalanish yoki amaliyot imtihonlarining 2022–2023 nashrlarini sotib olish orqali davom etdi. Ikkinchidan, shuni ta'kidlash kerakki GPT-4ning ishlashi test topshiruvchilarning qobiliyatlarini aks ettirishi shart emas, chunki u boshqa printsiplar va algoritmlar to'plamida ishlaydi.
Bu kabi katta yutuq ko'rsatadi mashinalar nafaqat insonga o'xshash aqlga qodir, balki bizdan ham ustun bo'lishi mumkin. Bu mashinalar tobora murakkab vazifalarni bajarishi mumkin bo'lgan kelajakka yo'l ochadi va oxir-oqibat ular bizga kundalik hayotimizda yordam beradigan kelajakka olib keladi.
Ko'proq o'qing: 5-yilda 2023+ eng kutilgan matndan tasvirga AI modellari |
GPT-4, masalan, imtihon topshiruvchilarning eng yaxshi 10% ball bilan simulyatsiya qilingan bar imtihonidan o'tadi; GPT-3.5 ball eng quyi 10% edi. Bu sezilarli yaxshilanish GPT-4ning ishlashi uning kattaroq o'quv ma'lumotlari va yaxshilangan arxitekturasi bilan bog'liq. Turli sohalarda, jumladan, tabiiy tilni qayta ishlash va avtomatlashtirilgan yozishda keng ko'lamli ilovalar bo'lishi kutilmoqda.
Ko'pgina zamonaviy (SOTA) modellari, shu jumladan qo'shimcha o'quv protokollari yoki benchmark-maxsus dizayndan foydalanishi mumkin bo'lganlar, shuningdek, mavjud katta til modellaridan sezilarli darajada oshib ketgan GPT-4.
Ichkarida ishlab chiquvchilar undan foydalanishgan GPT-4, bu dasturlash, sotish, qo'llab-quvvatlash va kontentni moderatsiya qilish kabi faoliyatga sezilarli ta'sir ko'rsatdi. Bizning moslashtirish usulimizning ikkinchi bosqichi hozirda davom etmoqda, chunki ishlab chiquvchilar undan AI natijalarini ko'rib chiqishda odamlarga yordam berish uchun foydalanadilar.
MMLU (Massive Multi-Task Language Understanding) maʼlumotlar toʻplami turli vazifalarda (57 ta sohani, jumladan, matematika, biologiya, huquq, ijtimoiy va gumanitar fanlar va boshqalarni qamrab olgan) tilni tushunish boʻyicha juda keng mavzulardagi savollarni oʻz ichiga oladi. Savolga to'rtta javob berish mumkin, ulardan biri to'g'ri. Ya'ni, tasodifiy taxminlar 25% to'g'ri javoblar natijasini ko'rsatadi. Savollar va ularning qiyinchiliklariga misollar uchun quyidagi rasmga qarang. O'rtacha shaxs-marker (ya'ni, bu olim emas, professor emas - belgi sifatida oy nurini ko'rsatadigan oddiy odam) savollarning 35 foiziga to'g'ri javob beradi; Biroq, mutaxassislar +/- 90% ballga erishishlari mumkin.
Dastlab, butun ma'lumotlar to'plami ingliz tilida edi. Ammo savollar va javoblar boshqa tillarga, ayniqsa kamroq tarqalgan tillarga tarjima qilinsa-chi? Model ular uchun qandaydir tarzda ishlaydi? Ushbu testda tarjima qilish uchun Microsoft Azure Translate xizmatidan foydalanilgan. Tarjimalar mukammal emas; ba'zi hollarda muhim ma'lumotlar yo'qoladi. Biroq, bu holatda ham, GPT-4 boshqa tillarda yaxshi ishlaydi. MMLU ning tarjima qilingan versiyalarida, GPT-4 boshqa yirik modellarning (shu jumladan Google’ning) ingliz tili darajasini tekshirilgan 24 ta tildan 26 tasida ortda qoldiradi.
Bundan tashqari, GPT-4 kamdan-kam tillarda yaxshiroq ishlaydi ChatGPT Ingliz tilida qildim (ChatGPT 70.1% ballga erishgan bo'lsa, Tailand uchun yangi modelning balli 71.8% ni tashkil etdi. Ingliz tilidan test uchun ball eng yuqori bo'ldi, bilan GPT-4 boshqa modellarga qaraganda 10% yaxshi ishlaydi, shu jumladan Google'dan eng katta PaLM. U 86.4%, ekspertlar guruhi esa 90% ball oldi.
- 2023 yilning yoziga kelib, sun'iy intellekt tufayli yangi quvvat darajasiga erishgan bo'lishi mumkin ChatGPTdan foydalanadigan chatbot GPT-4 algoritm va ustunlik qiladi GPT-3 570 marta. Turli elementlar hissa qo'shadi ChatGPTning muvaffaqiyati, jumladan uning dizayni ko'proq "odamga o'xshash" bo'lishi va uning samaradorligi va aniqligini oshirish uchun ma'lumotlarni to'plash va tabiiy tilni qayta ishlashning ilg'or usullaridan foydalanish.
- Microsoft va OpenAI Yanvar oyida hamkorlikni yangilash va Bing qidiruvi AI tomonidan kengaytirilgan qidirish imkoniyatlarini o'zlashtirish rejalarini e'lon qildi. Juda murakkab GPT3.5 modelni almashtirish, GPT4, endigina ishga tushirildi, va u tabiiy til so'rovlarini tushunish va aniqroq natijalarni taqdim etish uchun Bing qidiruvining imkoniyatlarini sezilarli darajada oshirish imkoniyatiga ega. Agar biror narsa noto'g'ri bo'lsa, yaxshi zaxira rejasiga ega bo'lish yaxshi fikr.
Batafsil tegishli yangiliklarni o'qing:
Masʼuliyatdan voz kechish
Bunga javoban Ishonch loyihasi bo'yicha ko'rsatmalar, iltimos, ushbu sahifada taqdim etilgan ma'lumotlar yuridik, soliq, investitsiya, moliyaviy yoki boshqa har qanday maslahat shakli sifatida talqin qilinmasligi va talqin qilinmasligini unutmang. Faqat yo'qotishingiz mumkin bo'lgan narsaga investitsiya qilish va agar shubhangiz bo'lsa, mustaqil moliyaviy maslahat olish muhimdir. Qo'shimcha ma'lumot olish uchun biz shartlar va emitent yoki reklama beruvchi tomonidan taqdim etilgan yordam va qo'llab-quvvatlash sahifalariga murojaat qilishni tavsiya qilamiz. MetaversePost to'g'ri, xolis hisobot berish majburiyatini oladi, lekin bozor sharoitlari ogohlantirilmasdan o'zgarishi mumkin.
Muallif haqida
Damir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.
Boshqa maqolalarDamir - guruh rahbari, mahsulot menejeri va muharrir Metaverse Post, AI/ML, AGI, LLMs, Metaverse va kabi mavzularni qamrab oladi Web3- tegishli sohalar. Uning maqolalari har oy milliondan ortiq foydalanuvchilarning katta auditoriyasini jalb qiladi. U SEO va raqamli marketing bo'yicha 10 yillik tajribaga ega mutaxassis bo'lib ko'rinadi. Damir haqida Mashable, Wired nashrlarida tilga olingan. Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto va boshqa nashrlar. U BAA, Turkiya, Rossiya va MDH davlatlari oʻrtasida raqamli koʻchmanchi sifatida sayohat qiladi. Damir fizika bo'yicha bakalavr darajasini oldi, uning fikricha, bu unga internetning doimiy o'zgaruvchan manzarasida muvaffaqiyatga erishish uchun zarur bo'lgan tanqidiy fikrlash qobiliyatlarini berdi.