Hugging Face CEO, 2024-cü ildə kiçik süni intellekt modellərinin üstünlük təşkil edəcəyini proqnozlaşdırır
Qısaca
2024-cü ildə Kiçik Dil Modellərinin yüksəlişi müşahidə olunacaq, çünki şirkətlər səmərəlilik, qənaətcillik və əlçatanlıq sərhədlərini zorlayır.
Üçün süni intellekt, 2024-cü il əhəmiyyətli dönüş nöqtəsini qeyd etməyə hazırlaşır - Kiçik Dil Modellərinin (SLMs) yüksəlişi ilə, çünki şirkətlər səmərəlilik, qənaətcillik və əlçatanlıq sərhədlərini itələyir.
Kütləvi Böyük Dil Modellərinin (LLM) hökmranlığından yığcam, güclü SLM-lərin meydana çıxmasına qədər olan səyahət dilləri yenidən formalaşdırmağı vəd edir. AI mənzərəsi.
Bu iddia öz dəstəyini şirkətin həmtəsisçisi və baş direktoru Clam Delangue tapdı Üzünü qucaqlayır.
“Microsoft AI tərəfindən Phi-2 indi Hugging Face-də bir nömrəli trend modelidir. 2024-cü il kiçik süni intellekt modelləri ili olacaq!” Delanq, dedi LinkedIn yazısı.
Bundan əlavə, dekabrın əvvəlində, Fransız AI başlanğıcı Mistral, qısa müddət sonra əhəmiyyətli dərəcədə artırdı $ 415 milyon maliyyələşdirmə raundunda keyfiyyətə rəqib olmaq qabiliyyətinə görə tez bir zamanda diqqəti cəlb edən açıq mənbəli SLM olan Mixtral 8x7B təqdim etdi. GPT-3Müəyyən etalonlarda .5, hamısı təvazökar 100 giqabayt RAM ilə bir kompüterdə işləyərkən.
“Mütəxəssislərin seyrək qarışığı” modeli adlandırılan Mistral yanaşması xüsusi tapşırıqlar üçün öyrədilmiş daha kiçik modelləri birləşdirir və diqqətəlayiq effektivliyə nail olur.
Geridə qalmamaq üçün texnologiya nəhəngi microsoft evdə yetişdirilən SLM-nin ən son versiyası olan Phi-2 ilə arenaya daxil oldu. Cəmi 2.7 milyard parametrlə nəzərəçarpacaq dərəcədə kiçik olan Phi-2 mobil telefonda işləmək üçün nəzərdə tutulmuşdur və sənayenin imkanlardan ödün vermədən modelləri azaltmaq öhdəliyini nümayiş etdirir.
Bəyənən modellər GPT-3, heyrətamiz 175 milyard parametrlə öyünərək insana bənzər mətn yaratmaq, suallara cavab vermək və sənədləri ümumiləşdirmək qabiliyyətini nümayiş etdirdi. Bununla belə, LLM-lərin özünəməxsus mənfi cəhətləri, o cümlədən səmərəlilik, qiymət və fərdiləşdirmə ilə bağlı narahatlıqlar SLM-lərin yüksəlişinə yol açmışdır.
Kiçik Ölçekli Dil Modelinin İnkişafını Təşviq edən Faktorlar
SLM-lər daha az parametrli sadələşdirilmiş yanaşma ilə öyünür, nəticədə daha sürətli nəticə çıxarma sürəti və daha yüksək ötürmə qabiliyyəti olur. Onların azaldılmış yaddaş və saxlama tələbləri hesablama proseslərini çevik edir, model tutumunun həmişə məlumat iştahının artmasına paralel olması ilə bağlı ənənəvi inamı rədd edir.
Böyük dil modelləri bəyənərkən GPT-3 hədsiz xərclərə məruz qalır – inkişaf üçün çox vaxt on milyonlarla dollar tələb olunur – SLM-lər sərfəli alternativ təqdim edir.
Bu modellər hazır ola bilən əmtəə avadanlıqlarında öyrədilə, yerləşdirilə və idarə oluna bilər ki, bu da onları bizneslər üçün maliyyə baxımından əlverişli seçimə çevirir. Üstəlik, onların təvazökar resurs tələbləri onları daha az gücə malik cihazlarda oflayn işləyən kənar hesablama tətbiqləri üçün ideal namizədlər kimi yerləşdirir.
Eynilə, SLM-lərin əsas gücü onların fərdiləşdirilməsindədir. Domenlər arasında güzəştləri təmsil edən daha böyük həmkarlarından fərqli olaraq, SLM-lər xüsusi tətbiqlər üçün yaxşı tənzimlənə bilər. Onların sürətli iterasiya dövrləri praktik təcrübəni asanlaşdırır, tərtibatçılara modelləri xüsusi ehtiyaclara uyğunlaşdırmağa imkan verir.
2024-cü ilə yaxınlaşdıqca kiçik dil modellərinin yüksəlişi süni intellektdə transformasiya dövrünə işarə edir. Mərhələ yenilik və əlçatanlığın yenidən birləşdiyi Kiçik AI Modelləri İli üçün hazırlanıbdefisüni intellektin imkanları yoxdur.
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Kumar AI/ML-nin dinamik kəsişmələri, marketinq texnologiyaları və kriptovalyuta, blokçeyn və digər inkişaf etməkdə olan sahələr üzrə ixtisaslaşan təcrübəli Texniki Jurnalistdir. NFTs. Sənayedə 3 ildən çox təcrübəsi olan Kumar, cəlbedici povestlər hazırlamaq, dərin müsahibələr aparmaq və hərtərəfli fikirlər çatdırmaqda sübut edilmiş bir təcrübə yaratmışdır. Kumarın təcrübəsi görkəmli sənaye platformaları üçün məqalələr, hesabatlar və tədqiqat nəşrləri daxil olmaqla yüksək təsirli məzmunun hazırlanmasında yatır. Texniki bilik və hekayəni özündə birləşdirən unikal bacarıq dəsti ilə Kumar mürəkkəb texnoloji konsepsiyaları müxtəlif auditoriyalara aydın və cəlbedici şəkildə çatdırmaqda üstündür.
Ətraflı məqalələrKumar AI/ML-nin dinamik kəsişmələri, marketinq texnologiyaları və kriptovalyuta, blokçeyn və digər inkişaf etməkdə olan sahələr üzrə ixtisaslaşan təcrübəli Texniki Jurnalistdir. NFTs. Sənayedə 3 ildən çox təcrübəsi olan Kumar, cəlbedici povestlər hazırlamaq, dərin müsahibələr aparmaq və hərtərəfli fikirlər çatdırmaqda sübut edilmiş bir təcrübə yaratmışdır. Kumarın təcrübəsi görkəmli sənaye platformaları üçün məqalələr, hesabatlar və tədqiqat nəşrləri daxil olmaqla yüksək təsirli məzmunun hazırlanmasında yatır. Texniki bilik və hekayəni özündə birləşdirən unikal bacarıq dəsti ilə Kumar mürəkkəb texnoloji konsepsiyaları müxtəlif auditoriyalara aydın və cəlbedici şəkildə çatdırmaqda üstündür.