Ziņojums Tehnoloģija
Marts 15, 2023

Facebook izstrādā jaunu metodi mākslīgā intelekta transformatoru veiktspējas dubultošanai

Īsumā

Facebook ir izstrādājis jaunu metodi mākslīgā intelekta transformatoru veiktspējas dubultošanai, pamatojoties uz transformatora arhitektūru.

Jaunā metode atrod līdzīgākos ielāpus spraugās starp dažādu bloku apstrādi un apvieno tos, lai samazinātu skaitļošanas sarežģītību.

Facebook ir izstrādājis a jaunā metode AI transformatoru veiktspējas dubultošanai. Metode ir pamatojoties uz transformatora arhitektūru un ir īpaši izstrādāts gariem tekstiem, piemēram, grāmatām, rakstiem un emuāriem. Jaunā AI transformatora mērķis ir uzlabot veiktspēju uz transformatoriem balstīti modeļi uz garas formas tekstu, padarot tos efektīvākus un efektīvākus garu secību apstrādē. AI transformatora rezultāti ir ļoti daudzsološi, un šai jaunajai metodei ir iespēja palīdzēt uzlabot uz transformatoriem balstītu modeļu veiktspēju dažādos uzdevumos.

Paredzams, ka šī jaunā metode būtiski ietekmēs dabiskās valodas apstrādes uzdevumus, piemēram, valodas tulkošanu, apkopojumu un jautājumu atbilžu sistēmas. Paredzams, ka tas arī novedīs pie sarežģītāku AI modeļu izstrādes, kas spēj apstrādāt garākus un sarežģītākus tekstus.

Facebook izstrādāja jaunu metodi mākslīgā intelekta transformatoru veiktspējas dubultošanai
Lasīt vairāk: 10+ labākie AI fotoattēlu redaktori 2023. gadā: tiešsaistē un bez maksas

Lai apstrādātu attēlu, mūsdienu transformatori to sagriež plāksteros (parasti kvadrātos: skatiet tālāk redzamo gif) un pēc tam izmanto šo daļiņu attēlojumu, no kuriem katrs ir attēlots ar “žetonu”. Transformatori, kā mēs zinām, darbojas lēnāk, jo vairāk ir šo marķieru gabalu (tas attiecas gan uz tekstiem, gan attēliem), un visizplatītākajam transformatoram ir kvadrātiskās attiecības. Tas ir, jo vairāk marķieru tiek pievienots, jo lēnāka kļūst apstrāde. Lai risinātu šo problēmu, pētnieki ir ierosinājuši dažādas metodes, lai samazinātu attēlu apstrādei nepieciešamo marķieru skaitu, piemēram, hierarhisku un adaptīvu apvienošanu. Šo metožu mērķis ir saglabāt produkcijas kvalitāti, vienlaikus samazinot skaitļošanas izmaksas.

Jaunā metode atrod līdzīgākos ielāpus spraugās starp dažādu bloku apstrādi un apvieno tos, lai samazinātu skaitļošanas sarežģītību. Apvienoto marķieru daļa ir hiperparametrs; jo augstāks tas ir, jo zemāka kvalitāte, bet arī lielāks paātrinājums. Eksperimenti liecina, ka ir iespējams apvienot aptuveni 40% žetonu ar kvalitātes zudumu 0.1-0.4% un iegūt dubultu paātrinājumu (tādējādi patērējot mazāk atmiņas). Šī jaunā metode ir daudzsološs risinājums, lai samazinātu attēlu apstrādes skaitļošanas sarežģītību, un tā varētu nodrošināt ātrāku un efektīvāku apstrādi, neapdraudot gala produkcijas kvalitāti.

Kad mēs vizualizējam, kurus ielāpus mēs apvienojam, mēs varam redzēt, ka tie atrodas 1) tuvu viens otram un 2) apraksta vienu un to pašu objektu (skatiet vienādas krāsas apgabalus GIF). Tas nozīmē, ka netiek zaudēta nozīmīga informācija; objekts paliek modeļa “redzes laukā”. Jo vēlāk tas tiek lietots transformatorā, jo vairāk marķieru tiek apvienoti (jo tie ir augstāka līmeņa attēlojumi, kas paši labi apraksta attēla saturu).

Šādas inženierijas pieejas, kuru pamatā ir atjautība un izpratne par to, kā kaut kas darbojas, izskatās ļoti pievilcīgi. Arī Meta izstrādātāji sola vairāk ieviest StableDiffusion, lai arī tur paātrinātu. Tas ir lieliski, ka, tā kā transformatori ir visur, šādus trikus var ātri ieviest plašā modeļu klāstā. Tas parāda inženiertehnisko risinājumu potenciālu plašai ietekmei dažādās nozarēs. Būs interesanti redzēt, kā šie sasniegumi notiks transformatoru modeļi laika gaitā turpinās attīstīties un uzlaboties.

  • Meta AI un Paperswithcode ir izlaiduši pirmo 120B modeli Galactica, kas apmācīts zinātniskos tekstos, ļaujot veikt precīzākas un ātrākas prognozes. Galactica mērķis ir palīdzēt pētniekiem nošķirt svarīgo no nebūtiskā.

Lasiet vairāk saistīto ziņu:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Vairāk rakstus
Damirs Jalalovs
Damirs Jalalovs

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

Nepastāvības apstākļos institucionālā apetīte pieaug pret Bitcoin ETF

Informācijas atklāšana, izmantojot 13F pieteikumus, atklāj ievērojamus institucionālos investorus, kas iesaistās Bitcoin ETF, uzsverot pieaugošo pieņemšanu ...

Uzziniet vairāk

Pienāk notiesāšanas diena: CZ liktenis ir līdzsvarā, jo ASV tiesa izskata DOJ lūgumu

Šodien ASV tiesā Sietlā Čanpens Džao ir gatavs notiesāt.

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
Injective apvieno spēkus ar AltLayer, lai nodrošinātu atkārtotu inEVM drošību
bizness Ziņojums Tehnoloģija
Injective apvieno spēkus ar AltLayer, lai nodrošinātu atkārtotu inEVM drošību
3. gada 2024. maijs
Masa sadarbojas ar Teller, lai ieviestu MASA aizdevumu fondu, ļaujot USDC aizņemties bāzē
Markets Ziņojums Tehnoloģija
Masa sadarbojas ar Teller, lai ieviestu MASA aizdevumu fondu, ļaujot USDC aizņemties bāzē
3. gada 2024. maijs
Velodrome nākamajās nedēļās izlaiž Superchain Beta versiju un izvēršas visās OP Stack Layer 2 blokķēdes
Markets Ziņojums Tehnoloģija
Velodrome nākamajās nedēļās izlaiž Superchain Beta versiju un izvēršas visās OP Stack Layer 2 blokķēdes
3. gada 2024. maijs
CARV paziņo par sadarbību ar Aethir, lai decentralizētu savu datu slāni un sadalītu atlīdzības
bizness Ziņojums Tehnoloģija
CARV paziņo par sadarbību ar Aethir, lai decentralizētu savu datu slāni un sadalītu atlīdzības
3. gada 2024. maijs
CRYPTOMERIA LABS PTE. LTD.