Xəbər Hesabatı Texnologiya
Mart 15, 2023

Facebook süni intellekt transformatorlarının performansını ikiqat artırmaq üçün yeni üsul hazırlayır

Qısaca

Facebook transformator arxitekturası əsasında süni intellekt transformatorlarının məhsuldarlığını ikiqat artırmaq üçün yeni üsul hazırlayıb.

Yeni üsul müxtəlif blokların işlənməsi arasındakı boşluqlarda ən oxşar yamaqları tapır və hesablama mürəkkəbliyini azaltmaq üçün onları birləşdirir.

Facebook inkişaf etdirdi yeni üsul AI transformatorlarının məhsuldarlığını ikiqat artırmaq üçün. Metoddur transformator arxitekturasına əsaslanır və xüsusi olaraq kitablar, məqalələr və bloglar kimi uzun formalı mətnlər üçün nəzərdə tutulmuşdur. Yeni AI transformatorunun məqsədi performansını artırmaqdır transformator əsaslı modellər uzun ardıcıllıqların idarə edilməsində onları daha səmərəli və effektiv etməklə uzun formalı mətndə. Süni intellekt transformatorunun nəticələri çox ümidvericidir və bu yeni metodun müxtəlif tapşırıqlar üzrə transformator əsaslı modellərin işini yaxşılaşdırmağa kömək etmək şansı var.

Bu yeni metodun dil tərcüməsi, ümumiləşdirmə və sual-cavab sistemləri kimi təbii dilin işlənməsi tapşırıqlarına əhəmiyyətli təsir göstərəcəyi gözlənilir. Bundan əlavə, daha uzun və daha mürəkkəb mətnləri idarə edə bilən daha mürəkkəb AI modellərinin inkişafına səbəb olacağı gözlənilir.

Facebook süni intellekt transformatorlarının məhsuldarlığını ikiqat artırmaq üçün yeni üsul hazırlayıb
Daha ətraflı: 10+ Ən yaxşı AI Foto Redaktorları 2023: Onlayn və Pulsuz

Təsviri emal etmək üçün müasir transformatorlar onu yamaqlara (adətən kvadratlar: aşağıdakı gif-ə baxın) kəsir və sonra hər biri “token” ilə təmsil olunan bu hissəciklərin təsvirləri üzərində işləyirlər. Transformatorlar, bildiyimiz kimi, bu işarə parçaları nə qədər çox olarsa, daha yavaş işləyir (bu həm mətnlərə, həm də şəkillərə aiddir) və ən çox yayılmış transformator kvadratik əlaqəyə malikdir. Yəni, daha çox token əlavə olunduqca, emal daha yavaş olur. Bu problemi həll etmək üçün tədqiqatçılar ierarxik və adaptiv hovuz kimi təsvirin işlənməsi üçün tələb olunan tokenlərin sayını azaltmaq üçün müxtəlif üsullar təklif ediblər. Bu üsullar hesablama xərclərini minimuma endirməklə yanaşı, məhsulun keyfiyyətini qorumaq məqsədi daşıyır.

Yeni üsul müxtəlif blokların işlənməsi arasındakı boşluqlarda ən oxşar yamaqları tapır və hesablama mürəkkəbliyini azaltmaq üçün onları birləşdirir. Birləşdirilmiş tokenlərin payı hiperparametrdir; nə qədər yüksək olarsa, keyfiyyət bir o qədər aşağı olar, həm də sürətlənmə bir o qədər yüksək olar. Təcrübələr göstərir ki, 40-0.1% keyfiyyət itkisi ilə tokenlərin təxminən 0.4% -ni birləşdirmək və ikiqat sürətlənmə əldə etmək mümkündür (beləliklə, daha az yaddaş sərf olunur). Bu yeni üsul təsvirin emalının hesablama mürəkkəbliyini azaltmaq üçün perspektivli həll yoludur və yekun nəticənin keyfiyyətinə xələl gətirmədən daha sürətli və daha səmərəli emal etməyə imkan verə bilər.

Hansı yamaqları birləşdirdiyimizi vizuallaşdırdıqda, onların 1) bir-birinə yaxın olduğunu və 2) eyni obyekti təsvir etdiyini görə bilərik (GIF-də eyni rəngli sahələrə baxın). Yəni heç bir əhəmiyyətli məlumat itirilmir; obyekt modelin “görünüş sahəsində” qalır. Bu, transformatorda nə qədər gec tətbiq edilsə, bir o qədər çox token birləşdirilir (çünki bunlar özləri təsvirin məzmununu yaxşı təsvir edən daha yüksək səviyyəli təmsillərdir).

İxtiraya və bir şeyin necə işlədiyini başa düşməyə əsaslanan bu cür mühəndislik yanaşmaları çox cəlbedici görünür. Həmçinin, Meta-nın tərtibatçıları orada da işləri sürətləndirmək üçün StableDiffusion-a daha çox şey gətirəcəklərini vəd edirlər. Möhtəşəmdir ki, transformatorlar hər yerdə olduğundan, bu cür hiylələr tez bir zamanda geniş modellərdə həyata keçirilə bilər. Bu, mühəndislik həllərinin müxtəlif sənaye sahələrinə geniş təsir göstərməsi potensialını göstərir. Bu irəliləyişlərin necə olacağını görmək maraqlı olacaq transformator modelləri zaman keçdikcə inkişaf etməyə və təkmilləşməyə davam edəcəkdir.

  • Meta AI və Paperswithcode daha dəqiq və daha sürətli proqnozlar verməyə imkan verən elmi mətnlər üzərində öyrədilmiş ilk 120B Galactica modelini buraxdılar. Galactica-nın məqsədi tədqiqatçılara vacib olanı əhəmiyyətsizdən ayırmağa kömək etməkdir.

Daha çox əlaqəli xəbərləri oxuyun:

Məsuliyyətdən imtina

uyğun olaraq Güvən Layihəsi qaydaları, lütfən nəzərə alın ki, bu səhifədə təqdim olunan məlumat hüquqi, vergi, investisiya, maliyyə və ya hər hansı digər məsləhət forması kimi təfsir edilməməlidir və təfsir edilməməlidir. Yalnız itirə biləcəyiniz şeyə investisiya qoymaq və hər hansı bir şübhəniz varsa, müstəqil maliyyə məsləhətləri axtarmaq vacibdir. Əlavə məlumat üçün biz emitent və ya reklamçı tərəfindən təmin edilən şərtlər və şərtlərə, həmçinin yardım və dəstək səhifələrinə müraciət etməyi təklif edirik. MetaversePost dəqiq, qərəzsiz hesabat verməyə sadiqdir, lakin bazar şərtləri xəbərdarlıq edilmədən dəyişdirilə bilər.

Müəllif haqqında

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

Ətraflı məqalələr
Damir Yalalov
Damir Yalalov

Damir komanda rəhbəri, məhsul meneceri və redaktordur Metaverse Post, AI/ML, AGI, LLMs, Metaverse və kimi mövzuları əhatə edir Web3- əlaqəli sahələr. Onun məqalələri hər ay bir milyondan çox istifadəçinin kütləsini cəlb edir. O, SEO və rəqəmsal marketinq sahəsində 10 illik təcrübəyə malik mütəxəssis kimi görünür. Damirin adı Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto və digər nəşrlər. O, rəqəmsal köçəri kimi BƏƏ, Türkiyə, Rusiya və MDB arasında səyahət edir. Damir fizika üzrə bakalavr dərəcəsi qazandı və onun fikrincə, bu, ona internetin daim dəyişən mənzərəsində uğur qazanmaq üçün lazım olan tənqidi düşünmə bacarıqlarını verdi. 

İnstitusional iştah dəyişkənlik fonunda Bitcoin ETF-lərə doğru artır

13F sənədləri vasitəsilə edilən açıqlamalar, Bitcoin ETF-ləri ilə məşğul olan görkəmli institusional investorları ortaya qoyur və bu, artan qəbulu vurğulayır ...

Daha çox məlumat

Hökm günü gəldi: ABŞ Məhkəməsi DOJ-nin iddiasını nəzərdən keçirərkən CZ-nin taleyi tarazlıqda qalır

Changpeng Zhao bu gün Sietldəki ABŞ məhkəməsində hökm oxumağa hazırlaşır.

Daha çox məlumat
İnnovativ Texniki İcmamıza Qoşulun
Daha çox oxu
Daha çox oxu
Injective inEVM-ə Yenidən Təhlükəsizliyi Gətirmək üçün AltLayer ilə Gücləri Birləşdirir
Biznes Xəbər Hesabatı Texnologiya
Injective inEVM-ə Yenidən Təhlükəsizliyi Gətirmək üçün AltLayer ilə Gücləri Birləşdirir
3 May 2024
Masa, MASA Kredit Hövzəsini təqdim etmək üçün Teller ilə Birləşir, Bazada USDC Borc Almağa imkan verir
Markets Xəbər Hesabatı Texnologiya
Masa, MASA Kredit Hövzəsini təqdim etmək üçün Teller ilə Birləşir, Bazada USDC Borc Almağa imkan verir
3 May 2024
Velodrome qarşıdakı həftələrdə Superchain Beta Versiyasını işə salır və OP Stack Layer 2 Blockchain-də genişlənir
Markets Xəbər Hesabatı Texnologiya
Velodrome qarşıdakı həftələrdə Superchain Beta Versiyasını işə salır və OP Stack Layer 2 Blockchain-də genişlənir
3 May 2024
CARV, məlumat təbəqəsini mərkəzləşdirməmək və mükafatları yaymaq üçün Aethir ilə tərəfdaşlıq elan edir
Biznes Xəbər Hesabatı Texnologiya
CARV, məlumat təbəqəsini mərkəzləşdirməmək və mükafatları yaymaq üçün Aethir ilə tərəfdaşlıq elan edir
3 May 2024
CRYPTOMERIA LABS PTE. LTD.