Rapport de nouvelles Technologie
16 mars 2023

GPT-4 Hérite de faits « hallucinants » et d’erreurs de raisonnement du passé GPT Des modèles photo

En bref

OpenAI dit GPT-4 a les mêmes limites que précédemment GPT numériques jumeaux (digital twin models).

GPT-4 il hallucine toujours les faits et fait des erreurs de raisonnement.

Toutefois, GPT-4 des scores 40 % plus élevés que OpenAIle dernier GPT-3.5 sur les évaluations contradictoires internes de la factualité de l'entreprise.

GPT-4 Hérite de faits « hallucinants » et d’erreurs de raisonnement du passé GPT Des modèles photo

OpenAI a averti les utilisateurs que son dernier modèle de langage, GPT-4, n’est pas encore totalement fiable et peut « halluciner » les faits et commettre des erreurs de raisonnement. La société exhorte les utilisateurs à faire preuve de prudence lorsqu’ils utilisent les résultats du modèle de langage, en particulier dans des « contextes à enjeux élevés ».

Cependant, la bonne nouvelle est que GPT-4 réduit considérablement les hallucinations par rapport aux modèles précédents. OpenAI prétend que GPT-4 des scores 40% plus élevés que le dernier GPT-3.5 sur les évaluations contradictoires internes de la factualité. 

via OpenAI

« Nous avons fait des progrès sur des références externes telles que TruthfulQA, qui teste la capacité du modèle à séparer les faits d'un ensemble d'énoncés incorrects sélectionnés de manière contradictoire. Ces questions sont associées à des réponses factuellement incorrectes qui sont statistiquement attrayantes », OpenAI a écrit dans un blog récents.

Malgré cette amélioration, le modèle manque toujours de connaissances sur les événements survenus après septembre 2021 et fait parfois de simples erreurs de raisonnement, tout comme les modèles précédents. De plus, il peut être trop crédule en acceptant de fausses déclarations évidentes des utilisateurs et échouer à des problèmes difficiles, tels que l'introduction de vulnérabilités de sécurité dans son code. Il ne vérifie pas non plus les informations qu'il fournit.

Comme ses prédécesseurs, GPT-4 peut générer des conseils nuisibles, du code bogué ou des informations inexactes. Cependant, les capacités supplémentaires du modèle conduisent à de nouvelles surfaces de risque qui doivent être comprises. Pour évaluer l'ampleur de ces risques, plus de 50 experts de divers domaines, notamment les risques d’alignement de l’IA, la cybersécurité, les risques biologiques, la confiance et la sécurité ainsi que la sécurité internationale, ont été engagés pour tester le modèle de manière contradictoire. Leurs commentaires et données ont ensuite été utilisés pour améliorer le modèle, par exemple en collectant des données supplémentaires pour améliorer le modèle. GPT-4La capacité de refuser les demandes sur la façon de synthétiser des produits chimiques dangereux.

L'un des principaux moyens OpenAI Ce qui réduit les émissions nocives consiste à incorporer un signal de récompense de sécurité supplémentaire lors de la formation RLHF (Reinforcement Learning from Human Feedback). Le signal entraîne le modèle à refuser les demandes de contenu préjudiciable, comme defirequis par les directives d'utilisation du modèle. La récompense est fournie par un GPT-4 classificateur zéro tir, qui juge les limites de sécurité et le style d'achèvement en fonction des invites liées à la sécurité.

OpenAI a également déclaré que cela avait réduit de 82 % la tendance du modèle à répondre aux demandes de contenu non autorisé par rapport à GPT-3.5 et GPT-4 répond aux demandes sensibles telles que les conseils médicaux et l'automutilation conformément aux politiques de l'entreprise 29 % plus souvent.

via OpenAI

Tandis que OpenAILes interventions ont accru la difficulté de susciter un mauvais comportement de la part de GPT-4, c'est toujours possible, et il existe encore des jailbreaks qui peuvent générer du contenu qui enfreint les directives d'utilisation. 

« À mesure que les systèmes d'IA deviennent plus répandus, atteindre des degrés élevés de fiabilité dans ces interventions deviendra de plus en plus critique. Pour l'instant, il est essentiel de compléter ces limitations par des techniques de sécurité au moment du déploiement, telles que la surveillance des abus », a ajouté la société.

OpenAI collabore avec des chercheurs externes pour mieux comprendre et évaluer les impacts potentiels de GPT-4 et ses modèles successeurs. L’équipe développe également des évaluations des capacités dangereuses qui pourraient émerger dans les futurs systèmes d’IA. Alors qu'ils continuent d'étudier le potentiel social et impacts économiques of GPT-4 et d'autres systèmes d'IA, OpenAI partageront leurs découvertes et leurs idées avec le public en temps voulu.

Lire la suite:

Mots clés:

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Cindy est journaliste à Metaverse Post, traitant de sujets liés à web3, NFT, métavers et IA, avec un focus sur des entretiens avec Web3 acteurs du secteur. Elle a parlé à plus de 30 cadres supérieurs et ce n'est pas fini, apportant leurs précieuses informations aux lecteurs. Originaire de Singapour, Cindy est désormais basée à Tbilissi, en Géorgie. Elle est titulaire d'un baccalauréat en communications et études médiatiques de l'Université d'Australie du Sud et possède une décennie d'expérience dans le journalisme et l'écriture. Contactez-la via [email protected] avec des pitchs de presse, des annonces et des opportunités d'interview.

Plus d'articles
Cindy Tan
Cindy Tan

Cindy est journaliste à Metaverse Post, traitant de sujets liés à web3, NFT, métavers et IA, avec un focus sur des entretiens avec Web3 acteurs du secteur. Elle a parlé à plus de 30 cadres supérieurs et ce n'est pas fini, apportant leurs précieuses informations aux lecteurs. Originaire de Singapour, Cindy est désormais basée à Tbilissi, en Géorgie. Elle est titulaire d'un baccalauréat en communications et études médiatiques de l'Université d'Australie du Sud et possède une décennie d'expérience dans le journalisme et l'écriture. Contactez-la via [email protected] avec des pitchs de presse, des annonces et des opportunités d'interview.

La frénésie DOGE : analyse de la récente hausse de valeur de Dogecoin (DOGE)

L’industrie des crypto-monnaies se développe rapidement et les pièces meme se préparent à une reprise significative. Dogecoin (DOGE), ...

En savoir plus

L'évolution du contenu généré par l'IA dans le métaverse

L'émergence du contenu génératif de l'IA est l'un des développements les plus fascinants de l'environnement virtuel...

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Scroll achève la mise à niveau du réseau principal de Bernoulli et prévoit une diminution de 10 fois des coûts de transaction
Rapport de nouvelles Technologie
Scroll achève la mise à niveau du réseau principal de Bernoulli et prévoit une diminution de 10 fois des coûts de transaction
29 avril 2024
OKX Jumpstart répertorie Runecoin et permet au BTC Staking de gagner des jetons RUNE
Marchés Rapport de nouvelles Technologie
OKX Jumpstart répertorie Runecoin et permet au BTC Staking de gagner des jetons RUNE
29 avril 2024
Les meilleures offres de la semaine, les investissements majeurs dans l'IA, l'informatique, Web3, et Crypto (22-26.04)
Digérer La Brochure Marchés Technologie
Les meilleures offres de la semaine, les investissements majeurs dans l'IA, l'informatique, Web3, et Crypto (22-26.04)
26 avril 2024
Vitalik Buterin commente la centralisation du PoW et note qu'il s'agissait d'une étape temporaire jusqu'au PoS
Rapport de nouvelles Technologie
Vitalik Buterin commente la centralisation du PoW et note qu'il s'agissait d'une étape temporaire jusqu'au PoS
26 avril 2024
CRYPTOMERIA LABS PTE. LTD.