Informe de noticias Tecnología
Febrero 24, 2023

Meta lanzamientos LLaMA: Un modelo de lenguaje fundamental de última generación para la investigación de IA

En Resumen

Meta ha anunciado el lanzamiento de un nuevo modelo de lenguaje grande llamado LLaMA, diseñado para ayudar a los investigadores de IA a avanzar en su trabajo en el campo de la IA.

LLaMA Está disponible en varios tamaños, con parámetros que van desde 7B a 65B, y está diseñado para ser versátil.

meta llama

Meta tiene liberado un nuevo modelo de lenguaje grande llamado LLaMA (Large Language Model Meta AI) para apoyar a los investigadores de IA. El modelo permitirá que más personas de la comunidad investigadora estudien modelos de lenguaje y proporcionar un acceso más fácil a este importante campo.

LLaMA está disponible en varios tamaños (parámetros 7B, 13B, 33B y 65B). Al entrenar modelos de base más pequeños como LLaMA, los investigadores pueden utilizar menos potencia informática y recursos para probar nuevos enfoques y explorar nuevos casos de uso. Meta escribió eso LLaMA Es ideal para ajustar una variedad de tareas, ya que se entrena con un gran conjunto de datos sin etiquetar. Meta afirma estar comprometido con prácticas responsables de IA y comparte una LLAMA modelo tarjeta que detalla cómo se construyó el modelo.

Desarrollar LLaMA, Meta seleccionó textos de los 20 idiomas más hablados, centrándose en los idiomas que utilizan los alfabetos latino y cirílico. Este modelo de lenguaje grande genera texto tomando una secuencia de palabras como entrada y prediciendo la siguiente palabra de forma recursiva, similar a otros modelos de esta categoría.

“Como modelo de base, LLaMA está diseñado para ser versátil y puede aplicarse a muchos casos de uso diferentes, en comparación con un modelo ajustado que está diseñado para una tarea específica. Al compartir el código para LLaMA, Otros los investigadores pueden probar más fácilmente nuevos enfoques para limitar o eliminar estos problemas en modelos de lenguaje grandes”,

Meta escribió.

La compañía admite que aún necesita abordar los riesgos de sesgo, comentarios tóxicos y alucinaciones en gran modelos de lenguaje, incluyendo LLaMA.

Meta está lanzando el modelo bajo una licencia no comercial enfocada en casos de uso de investigación "para mantener la integridad y evitar el uso indebido". Las personas y organizaciones que deseen acceder al modelo serán evaluadas caso por caso. Las partes elegibles incluyen investigadores académicos, organizaciones gubernamentales y de la sociedad civil y laboratorios de investigación de la industria en todo el mundo.

Puedes leer un artículo completo en LLaMA esta página. Si es elegible, también puede aplicar para probar el modelo de lenguaje.

Más información:

Tags:

Observación

En línea con la Directrices del Proyecto Confianza, tenga en cuenta que la información proporcionada en esta página no pretende ser ni debe interpretarse como asesoramiento legal, fiscal, de inversión, financiero o de cualquier otro tipo. Es importante invertir sólo lo que pueda permitirse perder y buscar asesoramiento financiero independiente si tiene alguna duda. Para mayor información sugerimos consultar los términos y condiciones así como las páginas de ayuda y soporte proporcionadas por el emisor o anunciante. MetaversePost se compromete a brindar informes precisos e imparciales, pero las condiciones del mercado están sujetas a cambios sin previo aviso.

Sobre el Autor

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

Más artículos
Agne Cimerman
Agne Cimerman

Agne es una periodista que cubre las últimas tendencias y desarrollos en metaverso, IA y Web3 industrias para la Metaverse Post. Su pasión por contar historias la ha llevado a realizar numerosas entrevistas con expertos en estos campos, buscando siempre descubrir historias apasionantes y atrapantes. Agne tiene una licenciatura en literatura y tiene una amplia experiencia escribiendo sobre una amplia gama de temas, incluidos viajes, arte y cultura. También se ofreció como editora voluntaria de la organización de derechos de los animales, donde ayudó a crear conciencia sobre cuestiones de bienestar animal. Contáctala en [email protected].

El frenesí de DOGE: análisis del reciente aumento de valor de Dogecoin (DOGE)

La industria de las criptomonedas se está expandiendo rápidamente y las monedas meme se están preparando para un repunte significativo. Dogecoin (DOGE),...

Para saber más

La evolución del contenido generado por IA en el metaverso

La aparición del contenido de IA generativa es uno de los desarrollos más fascinantes dentro del entorno virtual...

Para saber más
Únase a nuestra comunidad tecnológica innovadora
Leer Más
Leer más
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (22-26.04)
Digest Empresa Industrias Tecnología
Las principales ofertas de esta semana, importantes inversiones en inteligencia artificial, TI, Web3y Cripto (22-26.04)
Abril 26, 2024
Vitalik Buterin comenta sobre la centralización de PoW y señala que fue una etapa temporal hasta PoS
Informe de noticias Tecnología
Vitalik Buterin comenta sobre la centralización de PoW y señala que fue una etapa temporal hasta PoS
Abril 26, 2024
Offchain Labs revela el descubrimiento de dos vulnerabilidades críticas en las pruebas de fraude de OP Stack de Optimism
Informe de noticias Software Tecnología
Offchain Labs revela el descubrimiento de dos vulnerabilidades críticas en las pruebas de fraude de OP Stack de Optimism
Abril 26, 2024
El mercado abierto de Dymension para puentear la liquidez de RollApps eIBC se lanza en Mainnet
Informe de noticias Tecnología
El mercado abierto de Dymension para puentear la liquidez de RollApps eIBC se lanza en Mainnet 
Abril 26, 2024
CRYPTOMERIA LABORATORIOS PTE. LIMITADO.