Guanaco Potensial Açıq Mənbə kimi ortaya çıxır ChatGPT Rəqib
Qısaca
Vaşinqton Universitetinin tədqiqatçıları tərəfindən hazırlanmış açıq mənbəli chatbot olan Guanaco, rəqabət aparmağa can atır ChatGPT təlim üçün daha az vaxt və pul tələb edərkən.
Ancaq yeni bir araşdırma, Alpaca kimi modellərin effektivliyini şübhə altına aldı.
Vaşinqton Universitetinin tədqiqatçıları açıqlayıblar Guanako, performansına rəqib olmağı hədəfləyən açıq mənbəli chatbot ChatGPT təlim üçün tələb olunan vaxt və resursları əhəmiyyətli dərəcədə azaltmaqla yanaşı. Cənubi Amerika qohumunun adını daşıyır llamas, Guanaco üzərində qurulmuşdur LLaMA dil modelidir və QLoRA adlı yeni incə tənzimləmə metodunu özündə birləşdirir.
Guanaco-nun yaradıcıları iddia edirlər ki, o, müqayisə olunan performansa nail olur ChatGPT ancaq bir gündə məşq etmək olar. Bu əlamətdar nailiyyət təlim üçün lazım olan GPU yaddaşının miqdarını əhəmiyyətli dərəcədə azaldan dil modelinin incə tənzimləmə texnikası olan QLoRA tərəfindən mümkün olmuşdur. ikən ChatGPT böyük 780 GB GPU yaddaş tələb edir 65 milyard parametrli bir model üçün Guanaco-nun ən sadə versiyası yalnız 5 GB tələb edir.
Bu təsir edici effektivlik qazanmaları ilə Guanaco və oxşar açıq mənbəli modellər bahalı təlimin zəruri olduğu anlayışına meydan oxuyurlar. ən müasir dil modelləri. Quanakonun yaranması, Alpacavə digər modellər kimi bahalı modellərin gələcəyi ilə bağlı fərziyyələrə səbəb olan bu qatarın dəyərinin bir hissəsini təşkil edir GPT.
Bununla belə, açıq mənbəli modellərə dair bu optimist baxışla hamı razılaşmır. Bu yaxınlarda Kaliforniya Universiteti tərəfindən aparılan bir araşdırma şübhə doğurdu alpaka kimi modellərin imkanları haqqında məlumat verdi və onların əsl potensialı ilə bağlı suallar doğurdu. İlkin olaraq, tədqiqatçılar Guanaco yaradıcıları ilə oxşar nəticəyə gəldilər: düzgün öyrədildikdə, açıq mənbəli modellər rəqib ola bilər. GPT qabiliyyətlərdə. Əlavə testlər əhəmiyyətli bir məhdudiyyət aşkar etdi. Bu “Dolly” modelləri, bəzən adlandırdıqları kimi, məşq zamanı rastlaşdıqları problemlərin həllini təqlid etməkdə mahirdirlər. Bununla belə, onlar daha qabaqcıl modellərdən geri qalaraq, açıq şəkildə məruz qalmadıqları tapşırıqları yaxşı yerinə yetirmək üçün mübarizə aparırlar.
Bu ifşa onu göstərir ki təlimə milyonlarla sərmayə qoydu GPT və oxşar modellər boşuna olmaya bilər. Guanaco və onun həmkarları ümidverici nəticələr nümayiş etdirsələr də, hələ də daha mürəkkəb modellərin üstün olduğu sahələr var. Qeyd etmək lazımdır ki, Kaliforniya Universiteti tərəfindən aparılan araşdırma kimi bahalı modellərin açıq mənbə modellərini tam əvəz edə bilməsi ilə bağlı hökm sürən fikirlərə qarşı çıxır GPT.
Təbii dil emalı sahəsi inkişaf etdikcə, Guanaco və digər açıq mənbəli modellərin qurulmuş dillərə qarşı necə ədalətli olduğunu izləmək maraqlı olacaq. kimi meyarlar ChatGPT. Yüksək innovasiya və davamlı tədqiqat, şübhəsiz ki, dil modellərinin gələcəyinə təsir göstərəcək və hansı modellərin xüsusi tətbiqlər üçün əsas seçim olacağını müəyyən edəcəkdir.
- Dolly 2.0, kommersiya baxımından ilk açıq mənbəli 12B Chat-LLM, elan edildi Databricks tərəfindən. Bu, maşın öyrənmə sənayesi üçün əhəmiyyətli bir irəliləyişdir və müəssisələrə bahalı GPU klasterlərinə investisiya qoymadan effektiv dil modelləri yaratmağa imkan verir. Databricks, MIT lisenziyası altında EleutherAI-nin Pythia-5,000B dil modelini ehtiva edən açıq mənbəli dil modelini yaratmaq üçün 12 işçini cəlb etdi. Dolly 2.0, eləcə də əlaqəli kod MIT lisenziyası altında mövcuddur. Dolly 2.0 sənayeni dəyişdirmək potensialına malikdir və maşın öyrənməsi üçün əhəmiyyətli bir addımdır.
AI haqqında daha çox oxuyun:
Məsuliyyətdən imtina
uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.
Müəllif haqqında
Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.
Ətraflı məqalələrDamir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi.