Relatório de notícias SMW Equipar
10 de maio de 2023

Anthropic propõe uma 'IA contextual' para modelos de bate-papo com base em 60 princípios

Em Breve

OpenAI usa aprendizado por reforço de feedback humano (RLHF) para alinhar modelos de linguagem com princípios humanos, segurança e utilidade.

A Anthropic propôs uma abordagem alternativa: IA contextual, que envolve pessoas escrevendo uma constituição que o modelo deve seguir.

Esta constituição é baseada na Declaração de Direitos Humanos das Nações Unidas, nos Termos de Serviço da Apple, nos Princípios que Encorajam a Consideração de Perspectivas Não Ocidentais.

Anthropic propôs uma nova abordagem para treinar modelos de chat usando 'IA constitucional'. Este método baseia-se OpenAI'S aprendizagem de reforço do feedback humano, mas se baseia nele, evitando a necessidade de escrever amostras de treinamento profundas. Em vez disso, o modelo é treinado para responder às entradas por meio do uso de uma constituição que deve agir como um conjunto de leis a serem seguidas pelo modelo.

Anthropic propõe uma 'IA contextual' para modelos de bate-papo com base em 60 princípios
anthropic.com
Recomendado: Ex-OpenAI funcionários fundaram a Anthropic, uma empresa que atraiu mais de US$ 700 milhões em financiamento

Por meio desse método, a IA pode gerar suas próprias amostras de treinamento avaliando o que foi dito em relação ao seu conjunto de princípios legalmente aceitos. Esta técnica de economia de tempo pode ser vista como Isaac Asimov's Leis da Robótica por em prática.

Os princípios que formam a base do modelo são numerosos demais para serem discutidos em detalhes. No entanto, eles cobrem muitos tópicos, como moralidade, aversão ao risco, economia e inteligência artificial. Cada um foi desenvolvido para ajudar a orientar as decisões da IA ​​quando se trata de responder a prompts de conversação.

A Anthropic conseguiu treinar efetivamente um modelo de IA chamado Claude, que compete com sucesso com OpenAI'S ChatGPT. Usando o Método Constituição-IA, Claude poderia responder a prompts de conversação com um nível impressionante de precisão, mas melhorias adicionais são esperadas à medida que a Anthropic continua a desenvolver essa tecnologia revolucionária.

Usando o conjunto de princípios e alguns exemplos de processo, o modelo é ensinado a avaliar e revisar suas próprias respostas ao longo da primeira fase. A segunda etapa envolve o treinamento de um modelo usando aprendizado por reforço, mas, em vez de usar informações de humanos, ele usa feedback gerado por IA com base em um conjunto de princípios para selecionar a saída mais benigna.

De fato, essa nova abordagem tem o potencial de economizar tempo e dinheiro para empresas que não precisarão mais construir suas próprias amostras de treinamento. Em vez disso, esse método 'pronto' pode ser usado como base para a criação de modelos de ajuste personalizado - nenhum conhecimento de programação é necessário. Também é importante observar como essa tecnologia também promete aumentar a segurança quando se trata de bots conversacionais. Criando um conjunto de princípios legalmente aceitos mitiga o risco da IA ​​indo desonesta.

Portanto, a Constituição AI não apenas promete tornar o desenvolvimento do modelo de bate-papo mais fácil e rápido, mas também o tornará mais seguro. Uma situação ganha-ganha para o mundo da Inteligência Artificial e ChatBots.

Uma visão analítica da “IA contextual” da Anthropic para chatbots

A IA contextual da Anthropic é baseada na incorporação de mais de 60 princípios derivados da Declaração de Direitos Humanos das Nações Unidas, Termos de Serviço da Apple, Princípios que Encorajam a Consideração de Perspectivas Não Ocidentais, da mente profunda Regras do pardal e conjunto de pesquisa antrópica 1 e conjunto 2.

O facto de a IA poder agora ser ensinada a comportar-se de acordo com princípios derivados de um conjunto tão amplo e diversificado de fontes é verdadeiramente notável. Ao incorporar princípios da Declaração dos Direitos Humanos das Nações Unidas, por exemplo, as respostas dos chatbots refletem agora a importância de preservar a noção de liberdade, igualdade e fraternidade. Esses princípios são um componente vital para garantir que conversas de chatbot permanecer ético e respeitoso. Da mesma forma, a incorporação dos Termos de Serviço da Apple garante a chatbot considera os interesses de privacidade de seus usuários.

Os princípios que incentivam a consideração de perspectivas não ocidentais também desempenham um papel importante no modelo de “IA contextual”. Esses princípios refletem a necessidade de a IA respeitar outras culturas e garantir que as respostas do chatbot não sejam percebidas como prejudiciais ou ofensivas. Da mesma forma, as Regras do Sparrow do Deepmind determinam que o chatbot responda com respostas destinadas a construir um relacionamento com o usuário.

A incorporação do conjunto 1 e do conjunto 2 de pesquisa antrópica fornece a garantia final de que as conversas de IA permaneçam civilizadas e respeitosas. A IA é treinada para garantir que responda às perguntas de maneira atenciosa e cortês.

Em suma, o modelo “Contextual AI” da Anthropic é um avanço incrivelmente importante no campo da Pesquisa de IA. Ao permitir que a IA seja ensinada de acordo com os princípios derivados de uma gama tão diversa de fontes, as implicações éticas das conversas automatizadas são bastante aprimoradas.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Injective une forças com AltLayer para trazer segurança de restabelecimento para inEVM
O negócio Relatório de notícias Equipar
Injective une forças com AltLayer para trazer segurança de restabelecimento para inEVM
3 de maio de 2024
Masa se une ao Teller para introduzir o pool de empréstimos MASA, permitindo empréstimos em USDC na base
Mercados Relatório de notícias Equipar
Masa se une ao Teller para introduzir o pool de empréstimos MASA, permitindo empréstimos em USDC na base
3 de maio de 2024
Velodrome lança versão beta do Superchain nas próximas semanas e se expande para blockchains OP Stack Layer 2
Mercados Relatório de notícias Equipar
Velodrome lança versão beta do Superchain nas próximas semanas e se expande para blockchains OP Stack Layer 2
3 de maio de 2024
CARV anuncia parceria com Aethir para descentralizar sua camada de dados e distribuir recompensas
O negócio Relatório de notícias Equipar
CARV anuncia parceria com Aethir para descentralizar sua camada de dados e distribuir recompensas
3 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.