Vijesti Tehnologija
Ožujak 15, 2023

Facebook razvija novu metodu za udvostručenje performansi AI transformatora

Ukratko

Facebook je razvio novu metodu za udvostručenje performansi AI transformatora na temelju transformatorske arhitekture.

Nova metoda pronalazi najsličnije zakrpe u prazninama između obrade različitih blokova i kombinira ih kako bi se smanjila računalna složenost.

Facebook je razvio a Nova metoda za udvostručenje performansi AI transformatora. Metoda je na temelju arhitekture transformatora i posebno je dizajniran za duge tekstove kao što su knjige, članci i blogovi. Cilj novog AI transformatora je poboljšati performanse transformatorski modeli na tekstu dugog oblika čineći ih učinkovitijima i učinkovitijima u rukovanju dugim nizovima. Rezultati AI transformatora su vrlo obećavajući, a ova nova metoda ima priliku pomoći poboljšati izvedbu modela temeljenih na transformatorima na raznim zadacima.

Očekuje se da će ova nova metoda imati značajan utjecaj na zadatke obrade prirodnog jezika, kao što su jezični prijevod, sažimanje i sustavi odgovora na pitanja. Također se očekuje da će dovesti do razvoja sofisticiranijih modela umjetne inteligencije koji se mogu nositi s duljim i složenijim tekstovima.

Facebook je razvio novu metodu za udvostručenje performansi AI transformatora
Pročitajte više: 10+ najboljih AI uređivača fotografija 2023: online i besplatno

Kako bi obradili sliku, moderni transformatori je režu na dijelove (obično kvadrate: pogledajte gif ispod) i zatim rade na prikazima tih čestica, od kojih je svaka predstavljena "žetonom". Transformatori, kao što znamo, rade sporije što je više ovih tokena (ovo se odnosi i na tekstove i na slike), a najčešći transformator ima kvadratni odnos. Odnosno, što se više tokena dodaje, obrada postaje sporija. Kako bi riješili ovaj problem, istraživači su predložili različite tehnike za smanjenje broja tokena potrebnih za obradu slike, kao što su hijerarhijsko i adaptivno udruživanje. Ove metode imaju za cilj održati kvalitetu izlaza uz smanjenje troškova računanja.

Nova metoda pronalazi najsličnije zakrpe u prazninama između obrade različitih blokova i kombinira ih kako bi se smanjila računalna složenost. Udio spojenih tokena je hiperparametar; što je veći, to je niža kvaliteta, ali i veće ubrzanje. Eksperimenti pokazuju da je moguće spojiti približno 40% tokena uz gubitak kvalitete od 0.1-0.4% i dobiti dvostruko ubrzanje (tako se troši manje memorije). Ova nova metoda obećavajuće je rješenje za smanjenje računalne složenosti obrade slike i mogla bi omogućiti bržu i učinkovitiju obradu bez ugrožavanja kvalitete konačnog rezultata.

Kada vizualiziramo koje zakrpe spajamo, možemo vidjeti da su 1) blizu jedna druge i 2) opisuju isti objekt (pogledajte područja iste boje na GIF-u). Odnosno, nijedna značajna informacija nije izgubljena; predmet ostaje “u vidnom polju” modela. Što se kasnije ovo primijeni u transformatoru, to se više tokena spaja (budući da su to prikazi više razine koji sami dobro opisuju sadržaj slike).

Takvi inženjerski pristupi temeljeni na domišljatosti i razumijevanju kako nešto funkcionira izgledaju vrlo privlačno. Također, Meta-ini programeri obećavaju da će donijeti više u StableDiffusion kako bi i tamo ubrzali stvari. Sjajno je da se, budući da su transformatori posvuda, takvi trikovi mogu brzo implementirati u širok raspon modela. To pokazuje potencijal inženjerskih rješenja da imaju širok utjecaj u raznim industrijama. Bit će zanimljivo vidjeti kako će se taj napredak ostvariti modeli transformatora nastavit će se razvijati i poboljšavati tijekom vremena.

  • Meta AI i Paperswithcode objavili su prvi 120B model Galactica obučen na znanstvenim tekstovima, omogućujući točnija i brža predviđanja. Cilj Galactice je pomoći istraživačima da odvoje važno od nebitnog.

Pročitajte još povezanih vijesti:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Institucionalni apetit raste prema Bitcoin ETF-ovima usred volatilnosti

Objave putem 13F prijava otkrivaju značajne institucionalne ulagače koji se upuštaju u Bitcoin ETF-ove, naglašavajući sve veće prihvaćanje ...

Znati više

Stiže dan izricanja presude: CZ-ova sudbina visi na ravnoteži dok američki sud razmatra izjavu DOJ-a

Changpeng Zhao danas će se suočiti s kaznom na američkom sudu u Seattleu.

Znati više
Pridružite se našoj zajednici inovativnih tehnologija
opširnije
Čitaj više
Injective udružuje snage s AltLayerom kako bi unio sigurnost ponovnog postavljanja na inEVM
posao Vijesti Tehnologija
Injective udružuje snage s AltLayerom kako bi unio sigurnost ponovnog postavljanja na inEVM
Neka 3, 2024
Masa se udružuje s Tellerom kako bi uveli MASA Lending Pool, omogućujući USDC posuđivanje na bazi
tržišta Vijesti Tehnologija
Masa se udružuje s Tellerom kako bi uveli MASA Lending Pool, omogućujući USDC posuđivanje na bazi
Neka 3, 2024
Velodrome lansira Superchain Beta verziju u nadolazećim tjednima i proširuje se na OP Stack Layer 2 Blockchains
tržišta Vijesti Tehnologija
Velodrome lansira Superchain Beta verziju u nadolazećim tjednima i proširuje se na OP Stack Layer 2 Blockchains
Neka 3, 2024
CARV najavljuje partnerstvo s Aethirom za decentralizaciju svog podatkovnog sloja i distribuciju nagrada
posao Vijesti Tehnologija
CARV najavljuje partnerstvo s Aethirom za decentralizaciju svog podatkovnog sloja i distribuciju nagrada
Neka 3, 2024
CRYPTOMERIA LABS PTE. LTD.