Anthropic propõe uma 'IA contextual' para modelos de bate-papo com base em 60 princípios
Em Breve
OpenAI usa aprendizado por reforço de feedback humano (RLHF) para alinhar modelos de linguagem com princípios humanos, segurança e utilidade.
A Anthropic propôs uma abordagem alternativa: IA contextual, que envolve pessoas escrevendo uma constituição que o modelo deve seguir.
Esta constituição é baseada na Declaração de Direitos Humanos das Nações Unidas, nos Termos de Serviço da Apple, nos Princípios que Encorajam a Consideração de Perspectivas Não Ocidentais.
Anthropic propôs uma nova abordagem para treinar modelos de chat usando 'IA constitucional'. Este método baseia-se OpenAI'S aprendizagem de reforço do feedback humano, mas se baseia nele, evitando a necessidade de escrever amostras de treinamento profundas. Em vez disso, o modelo é treinado para responder às entradas por meio do uso de uma constituição que deve agir como um conjunto de leis a serem seguidas pelo modelo.
Recomendado: Ex-OpenAI funcionários fundaram a Anthropic, uma empresa que atraiu mais de US$ 700 milhões em financiamento |
Por meio desse método, a IA pode gerar suas próprias amostras de treinamento avaliando o que foi dito em relação ao seu conjunto de princípios legalmente aceitos. Esta técnica de economia de tempo pode ser vista como Isaac Asimov's Leis da Robótica por em prática.
Os princípios que formam a base do modelo são numerosos demais para serem discutidos em detalhes. No entanto, eles cobrem muitos tópicos, como moralidade, aversão ao risco, economia e inteligência artificial. Cada um foi desenvolvido para ajudar a orientar as decisões da IA quando se trata de responder a prompts de conversação.
A Anthropic conseguiu treinar efetivamente um modelo de IA chamado Claude, que compete com sucesso com OpenAI'S ChatGPT. Usando o Método Constituição-IA, Claude poderia responder a prompts de conversação com um nível impressionante de precisão, mas melhorias adicionais são esperadas à medida que a Anthropic continua a desenvolver essa tecnologia revolucionária.
De fato, essa nova abordagem tem o potencial de economizar tempo e dinheiro para empresas que não precisarão mais construir suas próprias amostras de treinamento. Em vez disso, esse método 'pronto' pode ser usado como base para a criação de modelos de ajuste personalizado - nenhum conhecimento de programação é necessário. Também é importante observar como essa tecnologia também promete aumentar a segurança quando se trata de bots conversacionais. Criando um conjunto de princípios legalmente aceitos mitiga o risco da IA indo desonesta.
Portanto, a Constituição AI não apenas promete tornar o desenvolvimento do modelo de bate-papo mais fácil e rápido, mas também o tornará mais seguro. Uma situação ganha-ganha para o mundo da Inteligência Artificial e ChatBots.
Uma visão analítica da “IA contextual” da Anthropic para chatbots
A IA contextual da Anthropic é baseada na incorporação de mais de 60 princípios derivados da Declaração de Direitos Humanos das Nações Unidas, Termos de Serviço da Apple, Princípios que Encorajam a Consideração de Perspectivas Não Ocidentais, da mente profunda Regras do pardal e conjunto de pesquisa antrópica 1 e conjunto 2.
O facto de a IA poder agora ser ensinada a comportar-se de acordo com princípios derivados de um conjunto tão amplo e diversificado de fontes é verdadeiramente notável. Ao incorporar princípios da Declaração dos Direitos Humanos das Nações Unidas, por exemplo, as respostas dos chatbots refletem agora a importância de preservar a noção de liberdade, igualdade e fraternidade. Esses princípios são um componente vital para garantir que conversas de chatbot permanecer ético e respeitoso. Da mesma forma, a incorporação dos Termos de Serviço da Apple garante a chatbot considera os interesses de privacidade de seus usuários.
Os princípios que incentivam a consideração de perspectivas não ocidentais também desempenham um papel importante no modelo de “IA contextual”. Esses princípios refletem a necessidade de a IA respeitar outras culturas e garantir que as respostas do chatbot não sejam percebidas como prejudiciais ou ofensivas. Da mesma forma, as Regras do Sparrow do Deepmind determinam que o chatbot responda com respostas destinadas a construir um relacionamento com o usuário.
A incorporação do conjunto 1 e do conjunto 2 de pesquisa antrópica fornece a garantia final de que as conversas de IA permaneçam civilizadas e respeitosas. A IA é treinada para garantir que responda às perguntas de maneira atenciosa e cortês.
Em suma, o modelo “Contextual AI” da Anthropic é um avanço incrivelmente importante no campo da Pesquisa de IA. Ao permitir que a IA seja ensinada de acordo com os princípios derivados de uma gama tão diversa de fontes, as implicações éticas das conversas automatizadas são bastante aprimoradas.
Leia mais sobre IA:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.
Mais artigosDamir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.