Stability AIStableVicuna é o primeiro chatbot treinado com feedback humano
Em Breve
Stability AI lança o StableVicuna, o primeiro chatbot de código aberto em grande escala, que usa Aprendizado por Reforço com Feedback Humano (RLHF).
StableVicuna é baseado no chatbot Vicuna e usa um parâmetro de 13 bilhões LLaMA modelo.
Stability AI tem introduzido seu mais recente avanço em IA, StableVicuna, o primeiro chatbot de código aberto em larga escala treinado com feedback humano. O inovador chatbot é uma criação de Stability AI, a empresa que criou o popular modelo de imagem de código aberto, Stable Diffusion, e o mais novo algoritmo de geração de imagem AI, DeepFloyd.
StableVicuna é baseado no chatbot Vicuna lançado em abril, que usa um parâmetro de 13 bilhões LLaMA modelo. O que define a variante Vicuna de Stability AI e Carper AI à parte é o uso de Aprendizagem por Reforço com Feedback Humano (RLHF). Este método permite que o modelo melhore continuamente.
Stability AI sugere que os chatbots são bem-sucedidos devido a dois tipos de métodos de treinamento: ajuste fino de instruções e aprendizagem por reforço por meio de feedback humano. No entanto, a maioria dos modelos de chatbot existentes utiliza apenas um destes métodos e não ambos. Recentemente, conjuntos de dados para treinamento RLHF tornaram-se disponíveis publicamente. Assim, juntamente com uma ferramenta de treinamento fácil de usar, isso permitiu a criação do StableVicuna, que é o primeiro modelo de chatbot que incorpora os dois tipos de treinamento.
StableVicuna incorpora geração de texto, funções matemáticas simples e a capacidade de escrever código. É comparável a outros chatbots de código aberto em benchmarks comuns.
De acordo com o O Decodificador, chatbots de código aberto ajustados com dados de outros chatbots correm o risco de amplificar erros e vieses existentes por meio de treinamento repetitivo, causando um efeito de câmara de eco. Os dados de ajuste fino também podem exacerbar as alucinações ao introduzir informações que não estão presentes no modelo original.
Os usuários podem acessar uma demonstração do chatbot em Abraçando o Rosto. A empresa também divulgou planos para fornecer o StableVicuna por meio de uma interface de bate-papo no futuro.
Leia mais:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Agne é uma jornalista que cobre as últimas tendências e desenvolvimentos no metaverso, IA e Web3 indústrias para o Metaverse Post. Sua paixão por contar histórias a levou a realizar inúmeras entrevistas com especialistas nessas áreas, sempre buscando descobrir histórias emocionantes e envolventes. Agne é bacharel em literatura e possui ampla experiência em redação sobre uma ampla variedade de tópicos, incluindo viagens, arte e cultura. Ela também foi voluntária como editora da organização de direitos dos animais, onde ajudou a aumentar a conscientização sobre questões de bem-estar animal. Entre em contato com ela [email protegido].
Mais artigosAgne é uma jornalista que cobre as últimas tendências e desenvolvimentos no metaverso, IA e Web3 indústrias para o Metaverse Post. Sua paixão por contar histórias a levou a realizar inúmeras entrevistas com especialistas nessas áreas, sempre buscando descobrir histórias emocionantes e envolventes. Agne é bacharel em literatura e possui ampla experiência em redação sobre uma ampla variedade de tópicos, incluindo viagens, arte e cultura. Ela também foi voluntária como editora da organização de direitos dos animais, onde ajudou a aumentar a conscientização sobre questões de bem-estar animal. Entre em contato com ela [email protegido].