Novice SMW Tehnologija
Maj 31, 2023

Demenca AI: Izzivi vsebine, ustvarjene z modelom, in njen vpliv na sisteme AI

Na kratko

Raziskovalci so odkrili pojav modelne demence, ki se nanaša na nepopravljive okvare, ki se pojavijo v modelih, ko izginejo repi prvotne porazdelitve vsebine.

Da bi ohranili prednosti modelov usposabljanja na internetnih podatkih, je treba najti rešitve za ublažitev morebitne izgube distribucije izvirne vsebine.

Hiter napredek tehnologije umetne inteligence je prinesel neverjetne dosežke pri obdelavi naravnega jezika in ustvarjanju slik. Veliki jezikovni modeli (LLM), kot so GPT-2, GPT-3 (.5) in GPT-4 so pokazali izjemno uspešnost pri različnih jezikovnih nalogah, medtem ko modeli, kot je npr ChatGPT so te jezikovne zmožnosti predstavili širši javnosti. Ker pa LLM postajajo vse bolj razširjeni in pomembno prispevajo k jeziku, ki ga najdemo na spletu, so raziskovalci odkrili zaskrbljujočo težavo, znano kot "modelna demenca«.

Demenca AI: Izzivi vsebine, ustvarjene z modelom, in njen vpliv na sisteme AI
Metaverse Post (mpost.io)
Priporočamo: OpenAI: Umetna inteligenca bi lahko povzročila veliko škode ljudem, vendar poskus zaustavitve napredka ni možnost

V nedavnem članku so raziskovalci osvetlili pojav modelne demence, ki se nanaša na nepopravljive okvare, ki se pojavijo v modelih, ko izginejo repi prvotne porazdelitve vsebine. Študija kaže, da lahko uporaba vsebine, ustvarjene z modelom, med usposabljanjem vodi do tega kognitivni upad v nastalih modelih. Ta učinek so opazili pri variacijskih samodejnih kodirnikih (VAE), Gaussovih mešanih modelih (GMM) in LLM. Ugotovitve poudarjajo, da je treba to vprašanje obravnavati, da bi ohranili koristi modeli usposabljanja na obsežnih podatkih, pridobljenih iz interneta.

arxiv.org/pdf/2305.17493.pdf

Raziskovalci nudijo teoretično razumevanje modelne demence in dokazujejo njeno razširjenost v različnih generativni modeli. Trdijo, da je treba ta pojav jemati resno, da se zagotovi nadaljnja učinkovitost modelov usposabljanja na obsežnem spletnih podatkov. Ker LLM vedno bolj prispevajo k jeziku in vsebini, ki je na voljo na spletu, vrednost podatkov zbrani iz pristnih človeških interakcij s sistemi postane še bolj kritično.

Uvedba stable diffusion, tehnika, ki je revolucionirala ustvarjanje podob iz opisno besedilo, nadalje ponazarja vpliv LLM-jev pri ustvarjanju vsebine. Vendar pa študija kaže, da lahko uporaba vsebine, ustvarjene z modelom, povzroči izgubo distribucije vsebine na koncu, kar lahko zmanjša raznolikost in bogastvo izvirnih podatkov.

Medtem ko obsežni podatki, postrgani iz spleta, zagotavljajo dragocen vpogled v človeške interakcije s sistemi, prisotnost vsebine, ki jih ustvarjajo LLM, uvajajo nove izzive. Raziskovalci poudarjajo, da je treba obravnavati modelno demenco in najti rešitve, ki ohranjajo prednosti modelov usposabljanja na internetnih podatkih, hkrati pa ublažijo morebitno izgubo distribucije izvirne vsebine.

Ker se področje umetne inteligence še naprej razvija, je za raziskovalce, razvijalce in oblikovalce politik ključnega pomena, da se zavedajo omejitev in izzivov, povezanih z modeli usposabljanja na vsebini, ustvarjeni z modeli. Z razumevanjem in obravnavanjem težav, kot je modelna demenca, lahko zagotovimo odgovorno in učinkovito uporabo tehnologije umetne inteligence v prihodnosti.

Preberite več o AI:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
L3 Blockchain Degen Chain sodeluje s kanalom za infrastrukturno platformo, da bi rešil težavo z izpadi
Novice Tehnologija
L3 Blockchain Degen Chain sodeluje s kanalom za infrastrukturno platformo, da bi rešil težavo z izpadi
Maj 13, 2024
3,050 ETH danes opranih iz denarnice z več podpisi Parity, pri čemer 83,017 ETH ostaja pod nadzorom hekerjev, zazna opozorila Cyvers
Prisotnost Novice Tehnologija
3,050 ETH danes opranih iz denarnice z več podpisi Parity, pri čemer 83,017 ETH ostaja pod nadzorom hekerjev, zazna opozorila Cyvers
Maj 13, 2024
Rudarski algoritem, ki ga poganja ZKPs, Soland napoveduje svoj zagon in 20-dnevno predprodajo rudarjev
Novice Tehnologija
Rudarski algoritem, ki ga poganja ZKPs, Soland napoveduje svoj zagon in 20-dnevno predprodajo rudarjev
Maj 13, 2024
Canaan lansira nov Avalon Bitcoin Miner A1566 z vodilno učinkovitostjo delovanja
Canaan lansira nov Avalon Bitcoin Miner A1566 z vodilno učinkovitostjo delovanja
Maj 13, 2024
CRYPTOMERIA LABS PTE. LTD.