Informe de noticias Tecnología
Abril 13, 2023

Databricks publica Dolly 2.0, el primer Chat-LLM 12B de código abierto disponible comercialmente

En Resumen

Databricks anunció el lanzamiento de Dolly 2.0 como el primer Chat-LLM 12B de código abierto disponible comercialmente, lo que permite a las empresas crear modelos de lenguaje potentes sin invertir en costosos clústeres de GPU.

Los ladrillos de datos tienen anunció el lanzamiento de Dolly 2.0 como el primer Chat-LLM 12B de código abierto disponible comercialmente. Dolly es un gran avance para la industria del aprendizaje automático, ya que permite a las empresas crear modelos de lenguaje potentes, como LLM autorregresivos con soporte de diálogo, sin tener que invertir en costosos clústeres de GPU.

Más información: Instrucciones de uso ChatGPT (GPT-4) gratis para siempre

Para obtener su modelo de lenguaje de código abierto, Databricks necesitaba un conjunto de datos grande y de alta calidad. Después de considerar inicialmente la Alpaca GPT-3 conjunto de datos y otros conjuntos de datos de código abierto que no permiten el uso comercial, decidieron construir su propio conjunto de datos de alta calidad. Para ello, emplearon a 5,000 personas y les pidieron que escribieran varios ejemplos que servirían para formar un LLM autorregresivo capaz de simplemente continuar el texto y no mantener un diálogo. Con la ayuda de grandes incentivos, como bonificaciones por escribir los mejores ejemplos, pudieron reunir un impresionante 15,000 conjuntos de datos de muestra.

Databricks dio el siguiente paso e incorporó EleutherAI Pitia-12B modelo de lenguaje con una licencia MIT y lo volvieron a entrenar en su propio conjunto de datos, lo que resultó en Dolly 2.0. Dolly 2.0 ha sido lanzado bajo una licencia MIT, junto con el código que lo acompaña. Con el lanzamiento de Dolly 2.0, la industria del aprendizaje automático ahora tiene una herramienta poderosa para crear modelos de lenguaje sólidos de manera rentable. Esto puede ser utilizado tanto por empresas como por individuos que buscan crear aplicaciones poderosas que puedan comprender y procesar lenguaje complejo.

En general, el lanzamiento de Dolly 2.0 como el primer Chat-LLM 12B de código abierto disponible comercialmente es un hito importante para la industria del aprendizaje automático. Al aprovechar la licencia del MIT y crear su propio conjunto de datos de alta calidad, Databricks ha hecho que los poderosos modelos de lenguaje sean accesibles tanto para empresas como para individuos. Dolly 2.0 está para revolucionar la industria y es un gran paso adelante para el aprendizaje automático.

Los usuarios ahora esperan que los desarrolladores cuantifiquen Dolly en 4 bits y lo aceleren para que se ejecute en la CPU, así como una respuesta de OpenAssistant, que se espera que proporcione su modelo en los próximos días.

  • La NTIA está solicitando comentarios públicos sobre posibles regulaciones que regular los sistemas de IA como ChatGPT para ayudar a la administración de Biden a garantizar que funcionen según lo prometido. La NTIA emitió una declaración sobre la elaboración de reglas de responsabilidad de la IA, que podría prevenir futuros contratiempos y minimizar los riesgos de amenazas hipotéticas.

Lea más sobre la IA:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Más artículos
Damir Yalalov
Damir Yalalov

Damir es el líder del equipo, gerente de producto y editor en Metaverse Post, que cubre temas como AI/ML, AGI, LLM, Metaverse y Web3-campos relacionados. Sus artículos atraen una audiencia masiva de más de un millón de usuarios cada mes. Parece ser un experto con 10 años de experiencia en SEO y marketing digital. Damir ha sido mencionado en Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto y otras publicaciones. Viaja entre los Emiratos Árabes Unidos, Turquía, Rusia y la CEI como nómada digital. Damir obtuvo una licenciatura en física, que él cree que le ha dado las habilidades de pensamiento crítico necesarias para tener éxito en el panorama siempre cambiante de Internet. 

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Injective une fuerzas con AltLayer para llevar la seguridad de recuperación a inEVM
Empresa Informe de noticias Tecnología
Injective une fuerzas con AltLayer para llevar la seguridad de recuperación a inEVM
3 de mayo de 2024
Masa se asocia con Teller para presentar el fondo de préstamos MASA y permite pedir prestado al USDC en base
Industrias Informe de noticias Tecnología
Masa se asocia con Teller para presentar el fondo de préstamos MASA y permite pedir prestado al USDC en base
3 de mayo de 2024
Velodrome lanza la versión Beta de Superchain en las próximas semanas y se expande a través de las cadenas de bloques OP Stack Layer 2
Industrias Informe de noticias Tecnología
Velodrome lanza la versión Beta de Superchain en las próximas semanas y se expande a través de las cadenas de bloques OP Stack Layer 2
3 de mayo de 2024
CARV anuncia asociación con Aethir para descentralizar su capa de datos y distribuir recompensas
Empresa Informe de noticias Tecnología
CARV anuncia asociación con Aethir para descentralizar su capa de datos y distribuir recompensas
3 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.