Rapport de nouvelles SMW Technologie
31 mai 2023

Démence IA : les défis du contenu généré par un modèle et son impact sur les systèmes d'IA

En bref

Les chercheurs ont découvert le phénomène de la démence des modèles, qui fait référence aux défauts irréversibles qui se produisent dans les modèles lorsque les queues de la distribution du contenu original disparaissent.

Pour préserver les avantages des modèles de formation sur les données Internet, des solutions doivent être trouvées pour atténuer la perte potentielle de distribution de contenu original.

Les progrès rapides de la technologie de l’IA ont donné lieu à des progrès incroyables en matière de traitement du langage naturel et de génération d’images. Les grands modèles de langage (LLM) comme GPT-2, GPT-3 (.5), et GPT-4 ont démontré des performances remarquables dans diverses tâches linguistiques, tandis que des modèles tels que ChatGPT ont présenté ces capacités linguistiques au grand public. Cependant, à mesure que les LLM deviennent plus répandus et contribuent de manière significative au langage trouvé en ligne, les chercheurs ont découvert un problème préoccupant connu sous le nom de «modèle de démence. »

Démence IA : les défis du contenu généré par un modèle et son impact sur les systèmes d'IA
Metaverse Post (mpost.io)
Recommandée: OpenAI: L'IA pourrait potentiellement faire beaucoup de mal aux gens, mais essayer d'arrêter le progrès n'est pas une option

Dans un article récent, des chercheurs ont mis en lumière le phénomène de démence des modèles, qui fait référence aux défauts irréversibles qui surviennent dans les modèles lorsque les queues de distribution du contenu original disparaissent. L'étude indique que l'utilisation de contenu généré par un modèle pendant la formation peut conduire à ce résultat. déclin cognitif dans les modèles résultants. Cet effet a été observé dans les auto-encodeurs variationnels (VAE), les modèles de mélange gaussien (GMM) et les LLM. Les résultats soulignent la nécessité de résoudre ce problème afin de préserver les avantages de modèles de formation sur des données à grande échelle obtenues sur Internet.

Arxiv.org/pdf/2305.17493.pdf

Les chercheurs fournissent une compréhension théorique de la démence modèle et démontrent sa prévalence dans divers modèles génératifs. Ils soutiennent que ce phénomène doit être pris au sérieux pour assurer l'efficacité continue des modèles de formation sur de vastes données Web. Alors que les LLM contribuent de plus en plus à la langue et au contenu disponibles en ligne, la valeur des données recueillies à partir d'interactions humaines authentiques avec les systèmes devient encore plus critique.

L'introduction d' stable diffusion, une technique qui a révolutionné la création d'images texte descriptif, illustre davantage l'impact des LLM dans la génération de contenu. Cependant, l'étude suggère que l'utilisation de contenu généré par un modèle peut entraîner la perte de la distribution de contenu en fin de chaîne, érodant potentiellement la diversité et la richesse des données d'origine.

Alors que les données à grande échelle extraites du Web fournissent des informations précieuses sur les interactions humaines avec les systèmes, la présence de le contenu généré par les LLM introduit de nouveaux défis. Les chercheurs soulignent la nécessité de lutter contre la démence des modèles et de trouver des solutions qui préservent les avantages des modèles de formation sur les données Internet tout en atténuant la perte potentielle de distribution de contenu original.

Alors que le domaine de l'IA continue de se développer, il est crucial que les chercheurs, les développeurs et les décideurs soient conscients des limites et des défis associés aux modèles de formation sur le contenu généré par des modèles. En comprenant et en traitant des problèmes tels que la démence modèle, nous pouvons garantir l'utilisation responsable et efficace de la technologie de l'IA à l'avenir.

En savoir plus sur l'IA :

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Hot Stories
Rejoignez notre newsletter.
Dernières infos

L’appétit institutionnel augmente pour les ETF Bitcoin dans un contexte de volatilité

Les divulgations via les dépôts 13F révèlent que des investisseurs institutionnels notables se sont lancés dans les ETF Bitcoin, soulignant une acceptation croissante de...

En savoir plus

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
L3 Blockchain Degen Chain s'associe à Infrastructure Platform Conduit pour résoudre son problème de temps d'arrêt
Rapport de nouvelles Technologie
L3 Blockchain Degen Chain s'associe à Infrastructure Platform Conduit pour résoudre son problème de temps d'arrêt
13 mai 2024
3,050 83,017 ETH blanchis aujourd'hui à partir d'un portefeuille de parité multi-signature et XNUMX XNUMX ETH restent sous le contrôle des pirates informatiques, détecte les alertes Cyvers
Marchés Rapport de nouvelles Technologie
3,050 83,017 ETH blanchis aujourd'hui à partir d'un portefeuille de parité multi-signature et XNUMX XNUMX ETH restent sous le contrôle des pirates informatiques, détecte les alertes Cyvers
13 mai 2024
Soland, l'algorithme minier alimenté par ZKP, annonce son lancement et sa prévente de mineurs de 20 jours
Rapport de nouvelles Technologie
Soland, l'algorithme minier alimenté par ZKP, annonce son lancement et sa prévente de mineurs de 20 jours
13 mai 2024
Canaan lance le nouveau mineur Avalon Bitcoin A1566 avec une efficacité de performance de premier plan
Canaan lance le nouveau mineur Avalon Bitcoin A1566 avec une efficacité de performance de premier plan
13 mai 2024
CRYPTOMERIA LABS PTE. LTD.