Informe de noticias Tecnología
Febrero 24, 2023

Meta lanzamientos LLaMA: Un modelo de lenguaje fundamental de última generación para la investigación de IA

En Resumen

Meta ha anunciado el lanzamiento de un nuevo modelo de lenguaje grande llamado LLaMA, diseñado para ayudar a los investigadores de IA a avanzar en su trabajo en el campo de la IA.

LLaMA Está disponible en varios tamaños, con parámetros que van desde 7B a 65B, y está diseñado para ser versátil.

meta llama

Meta tiene liberado un nuevo modelo de lenguaje grande llamado LLaMA (Large Language Model Meta AI) para apoyar a los investigadores de IA. El modelo permitirá que más personas de la comunidad investigadora estudien modelos de lenguaje y proporcionar un acceso más fácil a este importante campo.

LLaMA está disponible en varios tamaños (parámetros 7B, 13B, 33B y 65B). Al entrenar modelos de base más pequeños como LLaMA, los investigadores pueden utilizar menos potencia informática y recursos para probar nuevos enfoques y explorar nuevos casos de uso. Meta escribió eso LLaMA Es ideal para ajustar una variedad de tareas, ya que se entrena con un gran conjunto de datos sin etiquetar. Meta afirma estar comprometido con prácticas responsables de IA y comparte una LLAMA modelo tarjeta que detalla cómo se construyó el modelo.

Desarrollar LLaMA, Meta seleccionó textos de los 20 idiomas más hablados, centrándose en los idiomas que utilizan los alfabetos latino y cirílico. Este modelo de lenguaje grande genera texto tomando una secuencia de palabras como entrada y prediciendo la siguiente palabra de forma recursiva, similar a otros modelos de esta categoría.

“Como modelo de base, LLaMA está diseñado para ser versátil y puede aplicarse a muchos casos de uso diferentes, en comparación con un modelo ajustado que está diseñado para una tarea específica. Al compartir el código para LLaMA, Otros los investigadores pueden probar más fácilmente nuevos enfoques para limitar o eliminar estos problemas en modelos de lenguaje grandes”,

Meta escribió.

La compañía admite que aún necesita abordar los riesgos de sesgo, comentarios tóxicos y alucinaciones en gran modelos de lenguaje, incluyendo LLaMA.

Meta está lanzando el modelo bajo una licencia no comercial enfocada en casos de uso de investigación "para mantener la integridad y evitar el uso indebido". Las personas y organizaciones que deseen acceder al modelo serán evaluadas caso por caso. Las partes elegibles incluyen investigadores académicos, organizaciones gubernamentales y de la sociedad civil y laboratorios de investigación de la industria en todo el mundo.

Puedes leer un artículo completo en LLaMA esta página. Si es elegible, también puede aplicar para probar el modelo de lenguaje.

Más información:

Tags:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Más artículos
Agne Cimerman
Agne Cimerman

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Hot Stories

Inside Wall Street Memes (WSM): Revelando los titulares

by Viktoriia Palchik
07 de mayo de 2024

Descubra las cripto ballenas: quién es quién en el mercado

by Viktoriia Palchik
07 de mayo de 2024
Suscríbase a nuestro boletín.
Últimas Noticias

Crece el apetito institucional por los ETF de Bitcoin en medio de la volatilidad

Las divulgaciones a través de presentaciones 13F revelan que notables inversores institucionales incursionan en los ETF de Bitcoin, lo que subraya una creciente aceptación de...

Para saber más

Llega el día de la sentencia: el destino de CZ pende de un hilo mientras un tribunal de EE. UU. considera la petición del Departamento de Justicia

Changpeng Zhao está listo para enfrentar hoy su sentencia en un tribunal estadounidense en Seattle.

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Inside Wall Street Memes (WSM): Revelando los titulares
Empresa Industrias Historias y comentarios Tecnología
Inside Wall Street Memes (WSM): Revelando los titulares
7 de mayo de 2024
Descubra las cripto ballenas: quién es quién en el mercado
Empresa Industrias Historias y comentarios Tecnología
Descubra las cripto ballenas: quién es quién en el mercado
7 de mayo de 2024
Orbiter Finance se asocia con la red Zulu de capa 2 de Bitcoin y se implementa en Is Lwazi Testnet
Empresa Informe de noticias Tecnología
Orbiter Finance se asocia con la red Zulu de capa 2 de Bitcoin y se implementa en Is Lwazi Testnet 
7 de mayo de 2024
Crypto Exchange Bybit integra el USDe de Ethena Labs como activo colateral y permite pares comerciales BTC-USDe y ETH-USDe
Industrias Informe de noticias Tecnología
Crypto Exchange Bybit integra el USDe de Ethena Labs como activo colateral y permite pares comerciales BTC-USDe y ETH-USDe
7 de mayo de 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.