Tədqiqatçının fikrincə, bugünkü Böyük Dil Modelləri Kiçik Modellər olacaq OpenAI
Hyung Won Chung, qabaqcıl süni intellekt tədqiqatçısı, əvvəllər Google Brain-də çalışmış və hal-hazırda təşkilatın üzvüdür. OpenAI komanda, 45-cü ildə böyük dil modelləri dünyasını araşdırdığı düşündürücü 2023 dəqiqəlik bir çıxış etdi. Chung bu sahədə təcrübəyə malikdir; o, Google məqaləsinin ilk müəllifi idi "Ölçəkləmə Təlimatları-Finetuned Dil Modelləri,” böyük dil modellərinin təlimatlara əməl etmək üçün necə öyrədilə biləcəyini araşdırır.
Chung, geniş dil modelləri dünyasını dinamik olaraq vurğulayır. LLM dünyasında, fundamental fərziyyələrin adətən sabit qaldığı ənənəvi sahələrdən fərqli olaraq, rəhbər prinsip daim inkişaf edir. Gələcək nəsil modellərlə hazırda qeyri-mümkün və ya qeyri-mümkün hesab edilənlər mümkün ola bilər. O, LLM imkanları ilə bağlı əksər iddiaları “indilik” ilə qabaqcadan yazmağın əhəmiyyətini vurğulayır. Model bir tapşırığı yerinə yetirə bilər; sadəcə hələ bunu etməyib.
İndiki böyük modellər cəmi bir neçə ildən sonra kiçik modellər olacaq
Hyung Won Chung, OpenAI
Vasvası sənədlərə və təkrar istehsala ehtiyac AI tədqiqatı Çunqun nitqindən alınacaq ən mühüm dərslərdən biridir. Sahə inkişaf etdikcə davam edən işləri hərtərəfli sənədləşdirmək çox vacibdir. Bu strategiya təcrübələrin tez bir zamanda təkrarlanmasına və yenidən nəzərdən keçirilməsinə zəmanət verir ki, bu da tədqiqatçılara əvvəlki işlərə əsaslanmağa imkan verir. Bu təcrübə vasitəsilə ilkin tədqiqat zamanı praktiki olmayan qabiliyyətlərin gələcəkdə inkişaf edə biləcəyi qəbul edilir.
Chung çıxışının bir hissəsini məlumatların və model paralelliyinin incəliklərini aydınlaşdırmağa həsr edir. Süni intellektin texniki aspektlərini daha dərindən araşdırmaqda maraqlı olanlar üçün bu bölmə bu paralellik üsullarının daxili işlərinə dair dəyərli fikirlər təqdim edir. Bu mexanizmləri başa düşmək optimallaşdırmaq üçün çox vacibdir geniş miqyaslı model təlimi.
Chung iddia edir ki, LLM öncəsi məşq üçün istifadə olunan cari məqsəd funksiyası, Maksimum Ehtimal funksiyası həqiqətən kütləvi miqyaslara nail olmaq üçün darboğazdır, məsələn, tutumun 10,000 qatı. GPT-4. Maşın öyrənməsi irəlilədikcə, əl ilə hazırlanmış itki funksiyaları getdikcə məhdudlaşdırılır.
Chung, süni intellektin inkişafındakı növbəti paradiqmanın ayrı-ayrı alqoritmlər vasitəsilə öyrənmə funksiyalarını əhatə etdiyini təklif edir. Bu yanaşma, başlanğıc mərhələsində olsa da, mövcud məhdudiyyətlərdən kənarda genişlənmə vədinə malikdir. O, həmçinin, hələ də aradan qaldırılmalı olan çətinliklərə baxmayaraq, bu istiqamətdə addımlar kimi, Qaydaların Modelləşdirilməsi ilə İnsan Əlaqəsindən Gücləndirici Öyrənmə (RLHF) kimi davamlı səyləri vurğulayır.
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.