Novice Tehnologija
Marec 15, 2023

Facebook razvija novo metodo za podvojitev zmogljivosti AI transformerjev

Na kratko

Facebook je razvil novo metodo za podvojitev zmogljivosti AI transformatorjev, ki temelji na transformatorski arhitekturi.

Nova metoda najde najbolj podobne zaplate v vrzeli med obdelavo različnih blokov in jih združi za zmanjšanje računske kompleksnosti.

Facebook je razvil a nova metoda za podvojitev zmogljivosti transformatorjev AI. Metoda je temelji na transformatorski arhitekturi in je posebej zasnovan za daljša besedila, kot so knjige, članki in blogi. Cilj novega transformatorja AI je izboljšati zmogljivost transformatorski modeli na besedilo dolge oblike, tako da postanejo učinkovitejši in uspešnejši pri obravnavanju dolgih zaporedij. Rezultati transformatorja z umetno inteligenco so zelo obetavni in ta nova metoda lahko pomaga izboljšati učinkovitost transformatorskih modelov pri različnih nalogah.

Pričakuje se, da bo ta nova metoda imela pomemben vpliv na naloge obdelave naravnega jezika, kot so jezikovno prevajanje, povzemanje in sistemi odgovorov na vprašanja. Pričakuje se tudi, da bo pripeljalo do razvoja bolj izpopolnjenih modelov umetne inteligence, ki lahko obravnavajo daljša in bolj zapletena besedila.

Facebook je razvil novo metodo za podvojitev zmogljivosti transformatorjev AI
Preberite več: 10+ najboljših urejevalnikov fotografij z umetno inteligenco 2023: na spletu in brezplačno

Za obdelavo slike jo sodobni transformatorji razrežejo na zaplate (običajno kvadrate: glejte spodnji gif) in nato delujejo na predstavitvah teh delcev, od katerih je vsak predstavljen z »žetonom«. Transformatorji, kot vemo, delujejo počasneje, čim več je teh žetonov (to velja tako za besedila kot za slike), najpogostejši transformator pa ima kvadratni odnos. To pomeni, da ko je dodanih več žetonov, počasnejša postane obdelava. Da bi rešili to težavo, so raziskovalci predlagali različne tehnike za zmanjšanje števila žetonov, potrebnih za obdelavo slik, kot sta hierarhično in prilagodljivo združevanje. Cilj teh metod je ohraniti kakovost izhoda, hkrati pa zmanjšati računske stroške.

Nova metoda najde najbolj podobne zaplate v vrzeli med obdelavo različnih blokov in jih združi za zmanjšanje računske kompleksnosti. Delež združenih žetonov je hiperparameter; višje kot je, nižja je kakovost, a tudi večji je pospešek. Eksperimenti kažejo, da je mogoče združiti približno 40 % žetonov z izgubo kakovosti 0.1-0.4 % in doseči dvojno pospeševanje (s čimer porabimo manj pomnilnika). Ta nova metoda je obetavna rešitev za zmanjšanje računalniške kompleksnosti obdelave slik in bi lahko omogočila hitrejšo in učinkovitejšo obdelavo brez ogrožanja kakovosti končnega rezultata.

Ko vizualiziramo, katere zaplate združujemo, lahko vidimo, da so 1) blizu drug drugega in 2) opisujejo isti predmet (glejte območja iste barve na GIF-u). To pomeni, da se nobena pomembna informacija ne izgubi; objekt ostane »v vidnem polju« modela. Kasneje ko se to uporabi v transformatorju, več žetonov se združi (ker so to predstavitve višjega nivoja, ki same dobro opisujejo vsebino slike).

Takšni inženirski pristopi, ki temeljijo na iznajdljivosti in razumevanju, kako nekaj deluje, so videti zelo privlačni. Poleg tega Metini razvijalci obljubljajo, da bodo prinesli več v StableDiffusion, da bi pospešili stvari tudi tam. Čudovito je, ker so transformatorji povsod, takšne trike lahko hitro implementiramo v široko paleto modelov. To kaže potencial inženirskih rešitev za širok vpliv v različnih panogah. Zanimivo bo videti, kako bodo napredovali transformatorski modeli se bo sčasoma še naprej razvijal in izboljševal.

  • Meta AI in Paperswithcode so izdali prvi model 120B Galactica, usposobljen za znanstvena besedila, kar omogoča natančnejše in hitrejše napovedi. Cilj Galactice je pomagati raziskovalcem ločiti pomembno od nepomembnega.

Preberite več povezanih novic:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Injective združuje moči z AltLayer, da bi v inEVM prinesel varnost preoblikovanja
ŽELITE POSTATI PARTNER Novice Tehnologija
Injective združuje moči z AltLayer, da bi v inEVM prinesel varnost preoblikovanja
Maj 3, 2024
Masa se združuje s podjetjem Teller, da uvede MASA Lending Pool, ki omogoča izposojo USDC na osnovi
Prisotnost Novice Tehnologija
Masa se združuje s podjetjem Teller, da uvede MASA Lending Pool, ki omogoča izposojo USDC na osnovi
Maj 3, 2024
Velodrome v prihodnjih tednih lansira različico Superchain Beta in se širi po verigah blokov plasti 2 sklada OP
Prisotnost Novice Tehnologija
Velodrome v prihodnjih tednih lansira različico Superchain Beta in se širi po verigah blokov plasti 2 sklada OP
Maj 3, 2024
CARV napoveduje partnerstvo z Aethirjem za decentralizacijo njegove podatkovne plasti in razdeljevanje nagrad
ŽELITE POSTATI PARTNER Novice Tehnologija
CARV napoveduje partnerstvo z Aethirjem za decentralizacijo njegove podatkovne plasti in razdeljevanje nagrad
Maj 3, 2024
CRYPTOMERIA LABS PTE. LTD.