Pot 10, 2023

Anthropic proposa una "IA contextual" per a models de xat basada en 60 principis

Publicat: 10 de maig de 2023 a les 4:24 Actualitzat: 10 de maig de 2023 a les 4:25

Editat i verificat: 10 de maig de 2023 a les 4:24

En breu

OpenAI utilitza l'aprenentatge de reforç a partir de la retroalimentació humana (RLHF) per alinear-se models lingüístics amb principis humans, seguretat i utilitat.

Anthropic va proposar un enfocament alternatiu: la IA contextual, que implica que les persones escriguin una constitució que el model hauria de seguir.

Aquesta constitució es basa en la Declaració dels Drets Humans de les Nacions Unides, les condicions del servei d'Apple i els principis que fomenten la consideració de perspectives no occidentals.

Anthropic ha proposat un nou enfocament per formar models de xat utilitzant 'AI constitucional'. Aquest mètode es basa en OpenAI'S aprenentatge de reforç de comentaris humans, però es basa en això evitant la necessitat d'escriure mostres d'entrenament profund. En canvi, el model està entrenat per respondre a les aportacions mitjançant l'ús d'una constitució que pretén actuar com un conjunt de lleis que el model ha de seguir.

Anthropic proposa una "IA contextual" per a models de xat basada en 60 principis — anthropic.com

Recomanat: Ex-OpenAI els empleats van fundar Anthropic, una empresa que ha atret més de 700 milions de dòlars en finançament

Mitjançant aquest mètode, l'IA pot generar les seves pròpies mostres d'entrenament avaluant el que ha dit en comparació amb el seu conjunt de principis legalment acceptats. Aquesta tècnica d'estalvi de temps es pot veure com Isaac Asimov's Lleis de la robòtica posar en pràctica.

Els principis que formen la base del model són massa nombrosos per tractar-los en detall. Tanmateix, cobreixen molts temes, com ara la moral, l'aversió al risc, l'economia i la intel·ligència artificial. Cadascun s'ha desenvolupat per ajudar a guiar les decisions de la IA a l'hora de respondre indicacions conversacionals.

Anthropic ha aconseguit entrenar eficaçment un model d'IA anomenat Claude, amb el qual competeix amb èxit OpenAI'S ChatGPT. Utilitzant el Mètode Constitució-AI, Claude podria respondre a les indicacions de conversa amb un nivell de precisió impressionant, però s'esperen millores addicionals a mesura que Anthropic continuï basant-se en aquesta tecnologia que canvia el joc.

Utilitzant el conjunt de principis i alguns exemples de procés, el model s'ensenya com avaluar i revisar les seves pròpies respostes durant la primera fase. La segona etapa consisteix a entrenar un model mitjançant l'aprenentatge de reforç, però en comptes d'utilitzar l'aportació d'humans, fa servir la retroalimentació generada per IA basada en un conjunt de principis per seleccionar la sortida més benigna.

De fet, aquest nou enfocament té el potencial d'estalviar temps i diners per a les empreses que ja no hauran de construir les seves pròpies mostres de formació. Més aviat, aquest mètode "preparat" es pot utilitzar com a base per crear models personalitzats; no es requereix cap coneixement de programació. També és important assenyalar com aquesta tecnologia també promet augmentar la seguretat quan es tracta de bots de conversa. Creació d'un conjunt de principis legalment acceptats mitiga el risc de la IA que es torna canalla.

Per tant, Constitution AI no només promet fer que el desenvolupament del model de xat sigui més fàcil i ràpid, sinó que també ho farà més segur. Una situació de guanyar-guanyar tant per al món de la intel·ligència artificial com per als ChatBots.

Una mirada analítica a la "IA contextual" d'Anthropic per a Chatbots

L'IA contextual d'Anthropic es basa en la incorporació de més de 60 principis derivats de la Declaració dels Drets Humans de les Nacions Unides, les condicions del servei d'Apple, els principis que fomenten la consideració de perspectives no occidentals, De la ment profunda Regles de pardal i conjunt de recerca antròpica 1 i conjunt 2.

El fet que ara es pugui ensenyar a la IA a comportar-se d'acord amb principis derivats d'una varietat de fonts tan àmplia i diversa és realment notable. En incorporar principis de la Declaració dels Drets Humans de les Nacions Unides, per exemple, les respostes dels chatbots reflecteixen ara la importància de preservar la noció de llibertat, igualtat i fraternitat. Aquests principis són un component vital per garantir-ho converses de chatbot romandre ètics i respectuosos. Així mateix, la incorporació de les Condicions d'ús d'Apple garanteix la xat de xat té en compte els interessos de privadesa dels seus usuaris.

Els principis que fomenten la consideració de perspectives no occidentals també tenen un paper important en el model d'"IA contextual". Aquests principis reflecteixen la necessitat que la IA sigui respectuosa amb altres cultures i garanteixi que les respostes dels chatbots no es percebin com a nocives o ofensives. De la mateixa manera, les regles de Sparrow de Deepmind dicten que el chatbot respongui amb respostes destinades a establir una relació amb l'usuari.

La incorporació del conjunt de recerca antròpica 1 i del conjunt 2 ofereix la garantia final que les converses d'IA segueixen sent civils i respectuoses. La IA està entrenada per assegurar-se que respon a les preguntes d'una manera reflexiva i cortès.

Amb tot, el model d'"IA contextual" d'Anthropic és un avenç increïblement important en el camp de Investigació en IA. En permetre que la IA s'ensenya d'acord amb principis derivats d'una gamma tan diversa de fonts, es milloren molt les implicacions ètiques de les converses automatitzades.

Llegeix més sobre AI:

etiquetes:

renúncia

En línia amb la Directrius del projecte Trust, si us plau, tingueu en compte que la informació proporcionada en aquesta pàgina no pretén ni s'ha d'interpretar com a assessorament legal, fiscal, d'inversió, financer o de cap altra forma. És important invertir només el que et pots permetre perdre i buscar assessorament financer independent si tens dubtes. Per obtenir més informació, us suggerim que feu referència als termes i condicions, així com a les pàgines d'ajuda i assistència proporcionades per l'emissor o l'anunciant. MetaversePost es compromet a fer informes precisos i imparcials, però les condicions del mercat estan subjectes a canvis sense previ avís.

About The Autor

Damir és el líder d'equip, cap de producte i editor de Metaverse Post, que cobreix temes com AI/ML, AGI, LLMs, Metaverse i Web3-camps relacionats. Els seus articles atrauen una audiència massiva de més d'un milió d'usuaris cada mes. Sembla ser un expert amb 10 anys d'experiència en SEO i màrqueting digital. Damir ha estat esmentat a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i altres publicacions. Viatja entre els Emirats Àrabs Units, Turquia, Rússia i la CEI com a nòmada digital. Damir va obtenir una llicenciatura en física, que creu que li ha donat les habilitats de pensament crític necessàries per tenir èxit en el paisatge en constant canvi d'Internet.

més articles

Damir Yalalov

Hot Stories

Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM

by Alisa Davidson

Pot 03, 2024

Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base

by Alisa Davidson

Pot 03, 2024

Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP

by Alisa Davidson

Pot 03, 2024

CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses

by Alisa Davidson

Pot 03, 2024

Últimes notícies

Injective uneix forces amb AltLayer per aportar seguretat de restauració a inEVM

by Alisa Davidson

Pot 03, 2024

Masa s'uneix amb Teller per presentar el grup de préstecs MASA, que permet l'endeutament de l'USDC a la base

by Alisa Davidson

Pot 03, 2024

Velodrome llança la versió beta de Superchain en les properes setmanes i s'expandeix a les cadenes de blocs de la capa 2 de la pila OP

by Alisa Davidson

Pot 03, 2024

CARV anuncia associació amb Aethir per descentralitzar la seva capa de dades i distribuir recompenses

by Alisa Davidson

Pot 03, 2024

L'apetit institucional creix cap als ETF de Bitcoin enmig de la volatilitat

Les divulgacions a través de les presentacions 13F revelen inversors institucionals notables que s'estan incursionant en els ETF de Bitcoin, subratllant una acceptació creixent de...

saber Més