Uudiste reportaaž Tehnoloogia
Märtsil 15, 2023

Facebook töötab välja uue meetodi AI-transformerite jõudluse kahekordistamiseks

Põgusalt

Facebook on välja töötanud uue meetodi AI-trafode jõudluse kahekordistamiseks, mis põhineb trafo arhitektuuril.

Uus meetod leiab erinevate plokkide töötlemise vahedest kõige sarnasemad laigud ja kombineerib need arvutusliku keerukuse vähendamiseks.

Facebook on välja töötanud a uus meetod AI-trafode jõudluse kahekordistamiseks. Meetod on põhineb trafo arhitektuuril ja on spetsiaalselt loodud pika teksti (nt raamatud, artiklid ja ajaveebid) jaoks. Uue AI-trafo eesmärk on parandada selle jõudlust trafopõhised mudelid pika tekstiga, muutes need pikkade jadade käsitlemisel tõhusamaks ja tõhusamaks. AI-trafo tulemused on väga paljutõotavad ja see uus meetod võib aidata parandada trafopõhiste mudelite jõudlust mitmesuguste ülesannete täitmisel.

Sellel uuel meetodil on eeldatavasti oluline mõju loomuliku keele töötlemise ülesannetele, nagu keele tõlkimine, kokkuvõtete tegemine ja küsimustele vastamise süsteemid. Samuti eeldatakse, et see toob kaasa keerukamate AI mudelite väljatöötamise, mis suudavad käsitleda pikemaid ja keerukamaid tekste.

Facebook töötas välja uue meetodi AI-trafode jõudluse kahekordistamiseks
Loe rohkem: 10. aasta 2023+ parimat tehisintellekti fotoredaktorit: võrgus ja tasuta

Kujutise töötlemiseks lõikavad tänapäevased trafod selle laigudeks (tavaliselt ruutudeks: vt allpool olevat gifi) ja seejärel kasutavad neid osakesi, millest igaüks on tähistatud märgiga. Teatavasti töötavad transformaatorid seda aeglasemalt, mida rohkem neid märke on (see kehtib nii tekstide kui piltide kohta) ja kõige tavalisemal trafol on ruutsuhe. See tähendab, et mida rohkem märke lisatakse, seda aeglasemaks muutub töötlemine. Selle probleemi lahendamiseks on teadlased välja pakkunud erinevaid tehnikaid pilditöötluseks vajalike žetoonide arvu vähendamiseks, näiteks hierarhiline ja adaptiivne ühendamine. Nende meetodite eesmärk on säilitada väljundi kvaliteeti, minimeerides samal ajal arvutuskulusid.

Uus meetod leiab erinevate plokkide töötlemise vahedest kõige sarnasemad laigud ja kombineerib need arvutusliku keerukuse vähendamiseks. Ühendatud märkide osakaal on hüperparameeter; mida kõrgem see on, seda madalam on kvaliteet, aga ka kiirendus. Katsed näitavad, et on võimalik liita ligikaudu 40% žetoonidest 0.1-0.4% kvaliteedikaoga ja saada topeltkiirendus (kulutades seega vähem mälu). See uus meetod on paljutõotav lahendus pilditöötluse arvutusliku keerukuse vähendamiseks ning võimaldaks kiiremat ja tõhusamat töötlemist ilma lõppväljundi kvaliteeti kahjustamata.

Kui visualiseerime, milliseid plaastreid ühendame, näeme, et need on 1) üksteise lähedal ja 2) kirjeldavad sama objekti (vt GIF-i sama värvi alasid). See tähendab, et oluline teave ei lähe kaduma; objekt jääb mudeli “vaatevälja”. Mida hiljem seda trafos rakendatakse, seda rohkem märke liidetakse (kuna need on kõrgema taseme esitused, mis ise kirjeldavad pildi sisu hästi).

Sellised leidlikkusel ja millegi toimimise mõistmisel põhinevad insenertehnilised lähenemisviisid näevad väga ahvatlevad välja. Samuti lubavad Meta arendajad StableDiffusioni rohkem tuua, et ka seal asju kiirendada. See on äge, et kuna trafosid on kõikjal, saab selliseid nippe kiiresti rakendada väga paljudes mudelites. See näitab insenerilahenduste potentsiaali avaldada laiaulatuslikku mõju erinevates tööstusharudes. Huvitav on näha, kuidas need edusammud toimuvad trafo mudelid areneb ja paraneb aja jooksul edasi.

  • Meta AI ja Paperswithcode on välja andnud esimese 120B mudeli Galactica, mis on koolitatud teadustekstidel, võimaldades täpsemaid ja kiiremaid ennustusi. Galactica eesmärk on aidata teadlastel eraldada oluline ebaolulisest.

Loe rohkem seotud uudiseid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Veel artikleid
Damir Jalalov
Damir Jalalov

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks. 

Hot Stories
Liituge meie uudiskirjaga.
Uudised

Institutsionaalne isu kasvab volatiilsuse tõttu Bitcoini ETF-ide poole

13F-i dokumentide kaudu avaldatud teave paljastab märkimisväärsed institutsionaalsed investorid, kes tegelevad Bitcoini ETF-idega, rõhutades, et ...

Rohkem teada

Karistuspäev saabub: CZ saatus on tasakaalus, kuna USA kohus võtab DOJ palvet arvesse

Changpeng Zhao ootab täna ees kohtuotsus USA Seattle'i kohtus.

Rohkem teada
Liituge meie uuendusliku tehnikakogukonnaga
Loe rohkem
Loe edasi
Injective ühendab jõud AltLayeriga, et tuua inEVM-i uuesti turvalisus
Äri Uudiste reportaaž Tehnoloogia
Injective ühendab jõud AltLayeriga, et tuua inEVM-i uuesti turvalisus
Võib 3 2024
Masa teeb koostööd Telleriga, et tutvustada MASA laenufondi, mis võimaldab USDC baasil laenu võtta
turud Uudiste reportaaž Tehnoloogia
Masa teeb koostööd Telleriga, et tutvustada MASA laenufondi, mis võimaldab USDC baasil laenu võtta
Võib 3 2024
Velodrome toob lähinädalatel turule Superchaini beetaversiooni ja laieneb üle OP Stack Layer 2 plokiahelate
turud Uudiste reportaaž Tehnoloogia
Velodrome toob lähinädalatel turule Superchaini beetaversiooni ja laieneb üle OP Stack Layer 2 plokiahelate
Võib 3 2024
CARV teatab koostööst Aethiriga, et detsentraliseerida oma andmekiht ja jaotada auhindu
Äri Uudiste reportaaž Tehnoloogia
CARV teatab koostööst Aethiriga, et detsentraliseerida oma andmekiht ja jaotada auhindu
Võib 3 2024
CRYPTOMERIA LABS PTE. LTD.