Anthropic propose une « IA contextuelle » pour les modèles de chat basés sur 60 principes
En bref
OpenAI utilise l'apprentissage par renforcement à partir de la rétroaction humaine (RLHF) pour aligner modèles de langage avec des principes humains, de sécurité et d'utilité.
Anthropic a proposé une approche alternative : l'IA contextuelle, qui implique que des personnes rédigent une constitution que le modèle doit suivre.
Cette constitution est basée sur la Déclaration des droits de l'homme des Nations Unies, les conditions d'utilisation d'Apple, les principes encourageant la prise en compte des perspectives non occidentales.
Anthropic a proposé une nouvelle approche pour former des modèles de chat en utilisant 'IA constitutionnelle'. Cette méthode s'appuie sur OpenAI's apprentissage par renforcement à partir de la rétroaction humaine, mais s'appuie sur celle-ci en évitant d'avoir à écrire des échantillons d'entraînement approfondis. Au lieu de cela, le modèle est formé pour répondre aux entrées grâce à l'utilisation d'une constitution qui est censée agir comme un ensemble de lois que le modèle doit suivre.
Recommandée: Ex-OpenAI employés ont fondé Anthropic, une entreprise qui a attiré plus de 700 millions de dollars de financement |
Grâce à cette méthode, l'IA peut générer ses propres échantillons de formation en évaluant ce qu'elle a dit par rapport à son ensemble de principes légalement acceptés. Cette technique de gain de temps peut être considérée comme Isaac Asimov's Lois de la robotique mettre en pratique.
Les principes qui forment la base du modèle sont trop nombreux pour être discutés en détail. Cependant, ils couvrent de nombreux sujets, tels que la moralité, l'aversion au risque, l'économie et l'intelligence artificielle. Chacun a été développé afin d'aider à guider les décisions de l'IA lorsqu'il s'agit de répondre à invites conversationnelles.
Anthropic a réussi à former efficacement un modèle d'IA nommé Claude, qui rivalise avec succès avec OpenAI's ChatGPT. En utilisant le Méthode Constitution-IA, Claude pouvait répondre aux invites de conversation avec un niveau de précision impressionnant, mais des améliorations supplémentaires sont attendues à mesure qu'Anthropic continue de s'appuyer sur cette technologie révolutionnaire.
En effet, cette nouvelle approche a le potentiel de faire gagner du temps et de l'argent aux entreprises qui n'auront plus besoin de construire leurs propres échantillons de formation. Au contraire, cette méthode "prête à l'emploi" peut être utilisée comme base pour créer des modèles sur mesure - aucune connaissance en programmation n'est requise. Il est également important de noter comment cette technologie promet également d'augmenter la sécurité en ce qui concerne les bots conversationnels. Créer un ensemble de principes légalement acceptés atténue le risque de l'IA devient voyou.
Par conséquent, Constitution AI promet non seulement de rendre le développement de modèles de chat plus facile et plus rapide, mais il le rendra également plus sûr. Une situation gagnant-gagnant pour le monde de l'Intelligence Artificielle et des ChatBots.
Un regard analytique sur «l'IA contextuelle» d'Anthropic pour les chatbots
L'IA contextuelle d'Anthropic est basée sur l'incorporation de plus de 60 principes dérivés de la Déclaration des droits de l'homme des Nations Unies, des conditions d'utilisation d'Apple, des principes encourageant la prise en compte des perspectives non occidentales, L'esprit profond Règles Sparrow et Anthropic Research Set 1 et Set 2.
Le fait que l’IA puisse désormais apprendre à se comporter selon des principes issus d’un éventail de sources aussi vaste et diversifié est vraiment remarquable. En intégrant les principes de la Déclaration des droits de l'homme des Nations Unies, par exemple, les réponses des chatbots reflètent désormais l'importance de préserver la notion de liberté, d'égalité et de fraternité. De tels principes constituent un élément essentiel pour garantir que conversations par chatbot rester éthique et respectueux. De même, l'intégration des conditions de service d'Apple garantit le Chatbot tient compte des intérêts de confidentialité de ses utilisateurs.
Les principes encourageant la prise en compte des perspectives non occidentales jouent également un rôle important dans le modèle « IA contextuelle ». Ces principes reflètent la nécessité pour l'IA de respecter les autres cultures et de garantir que les réponses des chatbots ne soient pas perçues comme nuisibles ou offensantes. De même, les règles Sparrow de Deepmind dictent que le chatbot répond avec des réponses destinées à établir une relation avec l'utilisateur.
L'incorporation d'Anthropic Research Set 1 et Set 2 fournit la garantie finale que les conversations d'IA restent civiles et respectueuses. L'IA est formée pour s'assurer qu'elle répond aux questions de manière réfléchie et courtoise.
Dans l'ensemble, le modèle "Contextual AI" d'Anthropic est une percée incroyablement importante dans le domaine de Recherche sur l'IA. En permettant à l'IA d'être enseignée selon des principes issus d'un éventail aussi varié de sources, les implications éthiques des conversations automatisées sont grandement améliorées.
En savoir plus sur l'IA :
Clause de non-responsabilité
En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.
A propos de l'auteur
Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.
Plus d'articlesDamir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet.