Rapport de nouvelles SMW Technologie
10 mai 2023

Anthropic propose une « IA contextuelle » pour les modèles de chat basés sur 60 principes

En bref

OpenAI utilise l'apprentissage par renforcement à partir de la rétroaction humaine (RLHF) pour aligner modèles de langage avec des principes humains, de sécurité et d'utilité.

Anthropic a proposé une approche alternative : l'IA contextuelle, qui implique que des personnes rédigent une constitution que le modèle doit suivre.

Cette constitution est basée sur la Déclaration des droits de l'homme des Nations Unies, les conditions d'utilisation d'Apple, les principes encourageant la prise en compte des perspectives non occidentales.

Anthropic a proposé une nouvelle approche pour former des modèles de chat en utilisant 'IA constitutionnelle'. Cette méthode s'appuie sur OpenAI's apprentissage par renforcement à partir de la rétroaction humaine, mais s'appuie sur celle-ci en évitant d'avoir à écrire des échantillons d'entraînement approfondis. Au lieu de cela, le modèle est formé pour répondre aux entrées grâce à l'utilisation d'une constitution qui est censée agir comme un ensemble de lois que le modèle doit suivre.

Anthropic propose une « IA contextuelle » pour les modèles de chat basés sur 60 principes
anthropique.com
Recommandée: Ex-OpenAI employés ont fondé Anthropic, une entreprise qui a attiré plus de 700 millions de dollars de financement

Grâce à cette méthode, l'IA peut générer ses propres échantillons de formation en évaluant ce qu'elle a dit par rapport à son ensemble de principes légalement acceptés. Cette technique de gain de temps peut être considérée comme Isaac Asimov's Lois de la robotique mettre en pratique.

Les principes qui forment la base du modèle sont trop nombreux pour être discutés en détail. Cependant, ils couvrent de nombreux sujets, tels que la moralité, l'aversion au risque, l'économie et l'intelligence artificielle. Chacun a été développé afin d'aider à guider les décisions de l'IA lorsqu'il s'agit de répondre à invites conversationnelles.

Anthropic a réussi à former efficacement un modèle d'IA nommé Claude, qui rivalise avec succès avec OpenAI's ChatGPT. En utilisant le Méthode Constitution-IA, Claude pouvait répondre aux invites de conversation avec un niveau de précision impressionnant, mais des améliorations supplémentaires sont attendues à mesure qu'Anthropic continue de s'appuyer sur cette technologie révolutionnaire.

À l'aide de l'ensemble de principes et de quelques exemples de processus, le modèle apprend à évaluer et à réviser ses propres réponses tout au long de la première phase. La deuxième étape consiste à former un modèle à l'aide de l'apprentissage par renforcement, mais au lieu d'utiliser les commentaires des humains, il utilise des commentaires générés par l'IA basés sur un ensemble de principes pour sélectionner la sortie la plus bénigne.

En effet, cette nouvelle approche a le potentiel de faire gagner du temps et de l'argent aux entreprises qui n'auront plus besoin de construire leurs propres échantillons de formation. Au contraire, cette méthode "prête à l'emploi" peut être utilisée comme base pour créer des modèles sur mesure - aucune connaissance en programmation n'est requise. Il est également important de noter comment cette technologie promet également d'augmenter la sécurité en ce qui concerne les bots conversationnels. Créer un ensemble de principes légalement acceptés atténue le risque de l'IA devient voyou.

Par conséquent, Constitution AI promet non seulement de rendre le développement de modèles de chat plus facile et plus rapide, mais il le rendra également plus sûr. Une situation gagnant-gagnant pour le monde de l'Intelligence Artificielle et des ChatBots.

Un regard analytique sur «l'IA contextuelle» d'Anthropic pour les chatbots

L'IA contextuelle d'Anthropic est basée sur l'incorporation de plus de 60 principes dérivés de la Déclaration des droits de l'homme des Nations Unies, des conditions d'utilisation d'Apple, des principes encourageant la prise en compte des perspectives non occidentales, L'esprit profond Règles Sparrow et Anthropic Research Set 1 et Set 2.

Le fait que l’IA puisse désormais apprendre à se comporter selon des principes issus d’un éventail de sources aussi vaste et diversifié est vraiment remarquable. En intégrant les principes de la Déclaration des droits de l'homme des Nations Unies, par exemple, les réponses des chatbots reflètent désormais l'importance de préserver la notion de liberté, d'égalité et de fraternité. De tels principes constituent un élément essentiel pour garantir que conversations par chatbot rester éthique et respectueux. De même, l'intégration des conditions de service d'Apple garantit le Chatbot tient compte des intérêts de confidentialité de ses utilisateurs.

Les principes encourageant la prise en compte des perspectives non occidentales jouent également un rôle important dans le modèle « IA contextuelle ». Ces principes reflètent la nécessité pour l'IA de respecter les autres cultures et de garantir que les réponses des chatbots ne soient pas perçues comme nuisibles ou offensantes. De même, les règles Sparrow de Deepmind dictent que le chatbot répond avec des réponses destinées à établir une relation avec l'utilisateur.

L'incorporation d'Anthropic Research Set 1 et Set 2 fournit la garantie finale que les conversations d'IA restent civiles et respectueuses. L'IA est formée pour s'assurer qu'elle répond aux questions de manière réfléchie et courtoise.

Dans l'ensemble, le modèle "Contextual AI" d'Anthropic est une percée incroyablement importante dans le domaine de Recherche sur l'IA. En permettant à l'IA d'être enseignée selon des principes issus d'un éventail aussi varié de sources, les implications éthiques des conversations automatisées sont grandement améliorées.

En savoir plus sur l'IA :

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

L’appétit institutionnel augmente pour les ETF Bitcoin dans un contexte de volatilité

Les divulgations via les dépôts 13F révèlent que des investisseurs institutionnels notables se sont lancés dans les ETF Bitcoin, soulignant une acceptation croissante de...

En savoir plus

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Injective s'associe à AltLayer pour apporter la restauration de la sécurité à inEVM
La Brochure Rapport de nouvelles Technologie
Injective s'associe à AltLayer pour apporter la restauration de la sécurité à inEVM
3 mai 2024
Masa s'associe à Teller pour présenter le pool de prêts MASA et permettre à l'USDC d'emprunter sur la base
Marchés Rapport de nouvelles Technologie
Masa s'associe à Teller pour présenter le pool de prêts MASA et permettre à l'USDC d'emprunter sur la base
3 mai 2024
Velodrome lance la version bêta de Superchain dans les semaines à venir et s'étend aux blockchains OP Stack Layer 2
Marchés Rapport de nouvelles Technologie
Velodrome lance la version bêta de Superchain dans les semaines à venir et s'étend aux blockchains OP Stack Layer 2
3 mai 2024
CARV annonce un partenariat avec Aethir pour décentraliser sa couche de données et distribuer des récompenses
La Brochure Rapport de nouvelles Technologie
CARV annonce un partenariat avec Aethir pour décentraliser sa couche de données et distribuer des récompenses
3 mai 2024
CRYPTOMERIA LABS PTE. LTD.