Databricks anuncia Dolly, otro código abierto "económico" ChatGPT Fabricante
En Resumen
Dolly es un clon de Alpaca creado por Databricks para democratizar el acceso a grandes modelos de lenguaje.
Se puede entrenar con una pequeña cantidad de información, gastando solo $30 y 3 horas de trabajo.
La semana pasada se habló de un ChatGPT-producto similar llamado Alpaca, cuyo entrenamiento cuesta cientos de veces menos que OpenAI modelos debido al uso de información sintética generada utilizando GPT. Ahora reúnete Muñequita, un clon de Alpaca llamado así por el clon de la oveja Dolly, cuya misión es democratizar el acceso a grandes modelos de lenguaje. Programadores en Databricks dices que Dolly puede recibir capacitación sobre una pequeña cantidad de información por solo $ 30 y 3 horas de trabajo. En este caso, no necesita una supercomputadora por varias decenas de miles de dólares.
Se espera que Dolly cambie las reglas del juego en el campo del procesamiento del lenguaje natural, ya que permitirá a las pequeñas empresas y a las personas desarrollar sus propios modelos de lenguaje sin arruinarse. Esta democratización del acceso a grandes modelos de lenguaje podría dar lugar a un aumento de la innovación y la creatividad en el campo de la IA.
Dolly fue creado en base al 2020 Eleuther modelo de lenguaje, que tiene sólo 6 mil millones de parámetros en comparación con 135 mil millones en GPT. El modelo antiguo se modificó con la ayuda de la información recibida de Alpaca mencionada anteriormente, y se logró la capacidad de seguir las indicaciones del usuario, algo que no estaba en la versión original. Ahora puede funcionar como un chatbot, generar texto y realizar una lluvia de ideas sobre un tema determinado.
A pesar de tener sólo 6 mil millones de parámetros, Dolly ha demostrado un rendimiento impresionante en tareas lingüísticas y tiene el potencial de ser una alternativa más eficiente y rentable a modelos más grandes como GPT. Con un mayor desarrollo y capacitación, Dolly podría convertirse en una herramienta valiosa para aplicaciones de procesamiento del lenguaje natural.
A partir de esto, Databricks asume que la frialdad del mismo ChatGPT está precisamente en la calidad de la información sobre la que se entrenó el chatbot y no en el avance técnico del modelo en sí. Después de todo, Dolly, explican los desarrolladores, aprendió habilidades similares en muy poco tiempo, aunque no a un nivel tan alto. Esto destaca la importancia de los datos de capacitación de alta calidad en la creación de chatbots efectivos. También sugiere que los avances técnicos en el procesamiento del lenguaje natural pueden no ser siempre el factor clave para mejorar el rendimiento del chatbot.
- OpenAI, ChatGPT modelo de lenguaje es agregando nuevos complementos para ampliar sus capacidades. Estos los complementos se conectan ChatGPT a aplicaciones de terceros, lo que le permite recuperar información en tiempo real y basada en el conocimiento, así como realizar acciones como reservar un vuelo o pedir comida. Los desarrolladores pueden acceder a la documentación para crear sus complementos y ChatGPT actúa como una persona que llama a la API inteligente mediante el uso de la especificación de la API y las descripciones en lenguaje natural.
Leer más temas relacionados:
Observación
En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.
Sobre el Autor
Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.
Más artículosDamir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet.