Informe de notícies SMW Tecnologia
Pot 31, 2023

Demència d'IA: els reptes del contingut generat per models i el seu impacte en els sistemes d'IA

En breu

Els investigadors han descobert el fenomen de la demència del model, que fa referència als defectes irreversibles que es produeixen en els models quan desapareixen les cues de la distribució del contingut original.

Per preservar els beneficis dels models de formació sobre dades d'Internet, s'han de trobar solucions per mitigar la pèrdua potencial de distribució de contingut original.

Els ràpids avenços en la tecnologia d'IA han donat èxits increïbles en el processament del llenguatge natural i la generació d'imatges. Grans models de llenguatge (LLM) com GPT-2, GPT-3 (.5) i GPT-4 han demostrat un rendiment notable en diverses tasques lingüístiques, mentre que models com ara ChatGPT han introduït aquestes capacitats lingüístiques al públic en general. Tanmateix, a mesura que els LLM es fan més freqüents i contribueixen significativament al llenguatge que es troba en línia, els investigadors han descobert un problema preocupant conegut com "demència model".

Demència d'IA: els reptes del contingut generat per models i el seu impacte en els sistemes d'IA
Metaverse Post (mpost.io)
Recomanat: OpenAI: La IA podria fer molt mal a les persones, però intentar aturar el progrés no és una opció

En un article recent, els investigadors van posar llum sobre el fenomen de la demència del model, que fa referència als defectes irreversibles que es produeixen en els models quan desapareixen les cues de la distribució del contingut original. L'estudi indica que l'ús de contingut generat per models durant la formació pot conduir a això deteriorament cognitiu dels models resultants. Aquest efecte s'ha observat en autocodificadors variacionals (VAE), models de mescles gaussianes (GMM) i LLM. Les troballes emfatitzen la necessitat d'abordar aquest problema per preservar els beneficis de models de formació sobre dades a gran escala obtingudes d'Internet.

arxiv.org/pdf/2305.17493.pdf

Els investigadors proporcionen una comprensió teòrica de la demència model i demostren la seva prevalença en diversos models generatius. Argumenten que aquest fenomen s'ha de prendre seriosament per garantir l'eficàcia continuada dels models de formació en extensiu dades web. A mesura que els LLM contribueixen cada cop més al llenguatge i al contingut disponibles en línia, el valor de les dades recollits a partir d'interaccions humanes genuïnes amb els sistemes es fa encara més crític.

La introducció de stable diffusion, una tècnica que va revolucionar la creació d'imatges des de text descriptiu, exemplifica encara més l'impacte dels LLM en la generació de contingut. Tanmateix, l'estudi suggereix que l'ús de contingut generat per models pot provocar la pèrdua de la distribució del contingut final, potencialment erosionant la diversitat i la riquesa de les dades originals.

Si bé les dades a gran escala extretes del web proporcionen informació valuosa sobre les interaccions humanes amb els sistemes, la presència de els continguts generats pels LLM introdueixen nous reptes. Els investigadors subratllen la necessitat d'abordar la demència model i trobar solucions que preservin els beneficis dels models d'entrenament en dades d'Internet alhora que mitiguen la pèrdua potencial de distribució de contingut original.

A mesura que el camp de la IA continua desenvolupant-se, és crucial que els investigadors, els desenvolupadors i els responsables polítics siguin conscients de les limitacions i els reptes associats als models de formació sobre contingut generat per models. En comprendre i abordar problemes com la demència model, podem garantir l'ús responsable i eficaç de la tecnologia d'IA en el futur.

Llegeix més sobre AI:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

més articles
Damir Yalalov
Damir Yalalov

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet. 

L'apetit institucional creix cap als ETF de Bitcoin enmig de la volatilitat

Les divulgacions a través de les presentacions 13F revelen inversors institucionals notables que s'estan incursionant en els ETF de Bitcoin, subratllant una acceptació creixent de...

saber Més

Arriba el dia de la sentència: el destí de CZ està en equilibri mentre el tribunal nord-americà considera la petició del DOJ

Changpeng Zhao està a punt d'enfrontar-se avui a la sentència en un tribunal dels Estats Units a Seattle.

saber Més
Uneix-te a la nostra comunitat tecnològica innovadora
Més...
Llegeix més
El canvi de Donald Trump a la criptografia: d'oponent a defensor i què significa per al mercat de criptomonedes dels EUA
Negocis mercats Històries i ressenyes Tecnologia
El canvi de Donald Trump a la criptografia: d'oponent a defensor i què significa per al mercat de criptomonedes dels EUA
Pot 10, 2024
Layer3 llançarà el testimoni L3 aquest estiu, destinant el 51% del subministrament total a la comunitat
mercats Informe de notícies Tecnologia
Layer3 llançarà el testimoni L3 aquest estiu, destinant el 51% del subministrament total a la comunitat
Pot 10, 2024
L'advertència final d'Edward Snowden als desenvolupadors de Bitcoin: "Fes de la privadesa una prioritat a nivell de protocol o arrisca a perdre-la
mercats Seguretat Wiki Software Històries i ressenyes Tecnologia
L'advertència final d'Edward Snowden als desenvolupadors de Bitcoin: "Fes de la privadesa una prioritat a nivell de protocol o arrisca a perdre-la
Pot 10, 2024
Ethereum Layer 2 Network Mint, impulsat per l'optimisme, llançarà la seva xarxa principal el 15 de maig
Informe de notícies Tecnologia
Ethereum Layer 2 Network Mint, impulsat per l'optimisme, llançarà la seva xarxa principal el 15 de maig
Pot 10, 2024
CRYPTOMERIA LABS PTE. LTD.