Informe de noticias Tecnología
01 de mayo de 2023

Stability AI's StableVicuna es el primer chatbot entrenado con retroalimentación humana

En Resumen

Stability AI lanza StableVicuna, el primer chatbot de código abierto a gran escala, que utiliza el aprendizaje por refuerzo con retroalimentación humana (RLHF).

StableVicuna se basa en el chatbot Vicuña y utiliza un parámetro de 13 mil millones LLaMA modelo.

establovicuña

Stability AI tiene Introducido su último avance en IA, StableVicuna, el primer chatbot de código abierto a gran escala entrenado con retroalimentación humana. El innovador chatbot es una creación de Stability AI, la empresa que creó el popular modelo de imagen de código abierto, Stable Diffusion, y el algoritmo de generación de imágenes de IA más reciente, floydprofundo

StableVicuna se basa en el chatbot Vicuña lanzado en abril, que utiliza un parámetro de 13 mil millones. LLaMA modelo. ¿Qué distingue a la variante Vicuña de Stability AI y Carper AI aparte es su uso de aprendizaje reforzado con retroalimentación humana (RLHF). Este método permite que el modelo mejore continuamente.

Stability AI sugiere que los chatbots tienen éxito debido a dos tipos de métodos de entrenamiento: ajuste de la instrucción y aprendizaje reforzado a través de la retroalimentación humana. Sin embargo, la mayoría de los modelos de chatbot existentes utilizan sólo uno de estos métodos y no ambos. Recientemente, los conjuntos de datos para la capacitación de RLHF están disponibles públicamente. Así, junto con una herramienta de capacitación fácil de usar, esto ha permitido la creación de StableVicuna, que es la primera a gran escala modelo de chatbot que incorpore ambos tipos de formación.

StableVicuna incorpora generación de texto, funciones matemáticas simples y la capacidad de escribir código. Es comparable a otros chatbots de código abierto en puntos de referencia comunes. 

establovicuña
Fuente: Stability AI

Según la el decodificador, los chatbots de código abierto ajustados con datos de otros chatbots corren el riesgo de amplificar los errores y sesgos existentes a través del entrenamiento repetitivo, lo que provoca un efecto de cámara de eco. Los datos de ajuste fino también pueden exacerbar las alucinaciones al introducir información que no está presente en el modelo original.

Los usuarios pueden acceder a una demostración del chatbot en AbrazandoCara. La compañía también ha revelado planes para proporcionar StableVicuna a través de una interfaz de chat en el futuro.

Más información:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Más artículos
Agne Cimerman
Agne Cimerman

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más

Los fundadores de Samourai Wallet son acusados ​​de facilitar 2 millones de dólares en acuerdos en la Darknet

La detención de los fundadores de Samourai Wallet representa un revés notable para la industria, lo que subraya la persistente...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Galxe se asocia con Jambo para ampliar la accesibilidad global a Web3
Empresa Informe de noticias Tecnología
Galxe se asocia con Jambo para ampliar la accesibilidad global a Web3
2 de mayo de 2024
Med-Gemini de Google está listo para dar una ventaja a GPT-4 Con su desempeño superior en atención médica
AI Wiki Noticias Software Tecnología
Med-Gemini de Google está listo para dar una ventaja a GPT-4 Con su desempeño superior en atención médica
2 de mayo de 2024
El miembro del Consejo Legislativo de Hong Kong, Wu Jiezhuang, señala una demanda civil contra el intercambio de cifrado JPEX
Empresa Informe de noticias Tecnología
El miembro del Consejo Legislativo de Hong Kong, Wu Jiezhuang, señala una demanda civil contra el intercambio de cifrado JPEX
2 de mayo de 2024
AltLayer ingresa a la segunda fase de su iniciativa de participación y presenta el token reALT
Industrias Informe de noticias Tecnología
AltLayer ingresa a la segunda fase de su iniciativa de participación y presenta el token reALT
2 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.