Informe de noticias Tecnología
31 de mayo de 2023

Guanaco surge como potencial fuente abierta ChatGPT Fabricante

En Resumen

Guanaco, un chatbot de código abierto desarrollado por investigadores de la Universidad de Washington, aspira a competir con ChatGPT mientras que requiere menos tiempo y dinero para la formación.

Sin embargo, un nuevo estudio ha cuestionado la eficacia de modelos como Alpaca.

Investigadores de la Universidad de Washington han revelado Guanaco, un chatbot de código abierto que pretende rivalizar con el rendimiento de ChatGPT al tiempo que se reduce significativamente el tiempo y los recursos necesarios para la formación. El nombre de un pariente sudamericano de llamas, Guanaco está construido sobre el LLaMA modelo de lenguaje e incorpora un novedoso método de ajuste llamado QLoRA.

Guanaco surge como potencial fuente abierta ChatGPT Fabricante
Metaverse Post (mpost.io)

Los creadores de Guanaco afirman que logra un rendimiento comparable al ChatGPT pero se puede entrenar en un solo día. Esta notable hazaña es posible gracias a QLoRA, una técnica de ajuste fino del modelo de lenguaje que reduce sustancialmente la cantidad de memoria GPU necesaria para el entrenamiento. Mientras ChatGPT requiere la friolera de 780 GB de memoria GPU para un modelo con 65 mil millones de parámetros, la versión más simple de Guanaco solo requiere 5 GB.

Con estas impresionantes ganancias de eficiencia, Guanaco y modelos similares de código abierto están desafiando la noción de que se necesita una capacitación costosa para modelos lingüísticos de última generación. El surgimiento del guanaco, Alpacay Otros modelos ese tren a una fracción del costo ha llevado a especular sobre el futuro de modelos costosos como GPT.

Sin embargo, no todos están de acuerdo con esta visión optimista de los modelos de código abierto. Un estudio reciente realizado por la Universidad de California ha puesto en duda sobre las capacidades de modelos como las alpacas y planteó dudas sobre su verdadero potencial. Inicialmente, los investigadores llegaron a una conclusión similar a la de los creadores de Guanaco: cuando se entrenan adecuadamente, los modelos de código abierto pueden rivalizar GPT en capacidades. Otras pruebas revelaron una limitación significativa. Estos modelos “Dolly”, como a veces se les llama, son expertos en imitar soluciones a problemas que han encontrado durante el entrenamiento. Sin embargo, tienen dificultades para desempeñarse bien en tareas a las que no han estado expuestos explícitamente, quedando rezagados respecto de modelos más avanzados.

Esta revelación sugiere que el millones invertidos en formación GPT y modelos similares pueden no haber sido en vano. Si bien Guanaco y sus contrapartes demuestran resultados prometedores, todavía hay áreas donde sobresalen modelos más sofisticados. Vale la pena señalar que el investigación realizada por la Universidad de California desafía la noción predominante de que los modelos de código abierto pueden reemplazar completamente modelos costosos como GPT.

A medida que evolucione el campo del procesamiento del lenguaje natural, será interesante ver cómo Guanaco y otros modelos de código abierto se comparan con los modelos establecidos. puntos de referencia tales como ChatGPT. La alta tasa de innovación y la investigación continua, sin lugar a dudas, afectarán el futuro de los modelos de lenguaje y determinarán qué modelos se convertirán en la opción preferida para aplicaciones particulares.

  • Dolly 2.0, el primer Chat-LLM 12B de código abierto disponible comercialmente, ha sido anunciado por Databricks. Este es un avance significativo para la industria del aprendizaje automático, que permite a las empresas crear modelos de lenguaje efectivos sin invertir en costosos clústeres de GPU. Databricks contrató a 5,000 empleados para crear su modelo de lenguaje de código abierto, que incluía el modelo de lenguaje Pythia-12B de EleutherAI bajo una licencia del MIT. Dolly 2.0, así como el código asociado, está disponible bajo una licencia MIT. Dolly 2.0 tiene el potencial de cambiar la industria y es un importante paso adelante para el aprendizaje automático.

Lea más sobre la IA:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Hot Stories

Inside Wall Street Memes (WSM): Revelando los titulares

by Viktoriia Palchik
07 de mayo de 2024

Descubra las cripto ballenas: quién es quién en el mercado

by Viktoriia Palchik
07 de mayo de 2024
Suscríbase a nuestro boletín.
Últimas Noticias

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Inside Wall Street Memes (WSM): Revelando los titulares
Empresa Industrias Historias y comentarios Tecnología
Inside Wall Street Memes (WSM): Revelando los titulares
7 de mayo de 2024
Descubra las cripto ballenas: quién es quién en el mercado
Empresa Industrias Historias y comentarios Tecnología
Descubra las cripto ballenas: quién es quién en el mercado
7 de mayo de 2024
Orbiter Finance se asocia con la red Zulu de capa 2 de Bitcoin y se implementa en Is Lwazi Testnet
Empresa Informe de noticias Tecnología
Orbiter Finance se asocia con la red Zulu de capa 2 de Bitcoin y se implementa en Is Lwazi Testnet 
7 de mayo de 2024
Crypto Exchange Bybit integra el USDe de Ethena Labs como activo colateral y permite pares comerciales BTC-USDe y ETH-USDe
Industrias Informe de noticias Tecnología
Crypto Exchange Bybit integra el USDe de Ethena Labs como activo colateral y permite pares comerciales BTC-USDe y ETH-USDe
7 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.