Rapport de nouvelles Technologie
24 février 2023

Méta-versions LLaMA: Un modèle de langage fondamental de pointe pour la recherche en IA

En bref

Meta a annoncé la sortie d'un nouveau grand modèle de langage appelé LLaMA, conçu pour aider les chercheurs en IA à faire progresser leurs travaux dans le domaine de l'IA.

LLaMA est disponible en plusieurs tailles, allant des paramètres 7B à 65B, et est conçu pour être polyvalent.

objectif llama

Méta a libéré un nouveau grand modèle de langage appelé LLaMA (Large Language Model Meta AI) pour soutenir les chercheurs en IA. Le modèle permettra à davantage de personnes dans la communauté des chercheurs d'étudier modèles de langage et faciliter l'accès à ce domaine important.

LLaMA est disponible en plusieurs tailles (paramètres 7B, 13B, 33B et 65B). En formant des modèles de fondations plus petits comme LLaMA, les chercheurs peuvent utiliser moins de puissance de calcul et de ressources pour tester de nouvelles approches et explorer de nouveaux cas d'utilisation. Meta a écrit que LLaMA est idéal pour affiner une variété de tâches car il s'entraîne sur un large ensemble de données non étiquetées. Meta prétend s'engager en faveur de pratiques d'IA responsables et partage un LLAMA modèle carte qui détaille comment le modèle a été construit.

Développer LLaMA, Meta a sélectionné des textes dans les 20 langues les plus parlées, en se concentrant sur les langues utilisant les alphabets latin et cyrillique. Ce grand modèle de langage génère du texte en prenant une séquence de mots en entrée et en prédisant le mot suivant de manière récursive, à l'instar d'autres modèles de cette catégorie.

« En tant que modèle de base, LLaMA est conçu pour être polyvalent et peut être appliqué à de nombreux cas d’utilisation différents, par rapport à un modèle affiné conçu pour une tâche spécifique. En partageant le code pour LLaMA, autre les chercheurs peuvent plus facilement tester de nouvelles approches limiter ou éliminer ces problèmes dans les grands modèles de langage »,

Meta a écrit.

L'entreprise admet qu'elle doit encore faire face aux risques de biais, de commentaires toxiques et d'hallucinations en grande partie modèles de langage, dont LLaMA.

Meta publie le modèle sous une licence non commerciale axée sur les cas d'utilisation de la recherche "pour maintenir l'intégrité et prévenir les abus". Les individus et les organisations souhaitant accéder au modèle seront évalués au cas par cas. Les parties éligibles comprennent les chercheurs universitaires, les organisations gouvernementales et de la société civile, ainsi que les laboratoires de recherche industriels du monde entier.

Vous pouvez lire un article entier sur LLaMA ici. Si éligible, vous pouvez également vous inscrire pour tester le modèle de langage.

Lire la suite:

Mots clés:

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Agne est une journaliste qui couvre les dernières tendances et développements dans le métaverse, l'IA et Web3 industries pour la Metaverse Post. Sa passion pour la narration l'a amenée à mener de nombreux entretiens avec des experts dans ces domaines, cherchant toujours à découvrir des histoires passionnantes et engageantes. Agne est titulaire d'un baccalauréat en littérature et possède une vaste expérience en rédaction sur un large éventail de sujets, notamment les voyages, l'art et la culture. Elle s'est également portée volontaire en tant que rédactrice pour une organisation de défense des droits des animaux, où elle a contribué à sensibiliser les gens aux problèmes de bien-être animal. Contactez-la au [email protected].

Plus d'articles
Agne Cimerman
Agne Cimerman

Agne est une journaliste qui couvre les dernières tendances et développements dans le métaverse, l'IA et Web3 industries pour la Metaverse Post. Sa passion pour la narration l'a amenée à mener de nombreux entretiens avec des experts dans ces domaines, cherchant toujours à découvrir des histoires passionnantes et engageantes. Agne est titulaire d'un baccalauréat en littérature et possède une vaste expérience en rédaction sur un large éventail de sujets, notamment les voyages, l'art et la culture. Elle s'est également portée volontaire en tant que rédactrice pour une organisation de défense des droits des animaux, où elle a contribué à sensibiliser les gens aux problèmes de bien-être animal. Contactez-la au [email protected].

L’appétit institutionnel augmente pour les ETF Bitcoin dans un contexte de volatilité

Les divulgations via les dépôts 13F révèlent que des investisseurs institutionnels notables se sont lancés dans les ETF Bitcoin, soulignant une acceptation croissante de...

En savoir plus

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Inside Wall Street Memes (WSM) : dévoiler les gros titres
La Brochure Marchés Histoires et critiques Technologie
Inside Wall Street Memes (WSM) : dévoiler les gros titres
7 mai 2024
Découvrez les crypto-baleines : qui fait quoi sur le marché
La Brochure Marchés Histoires et critiques Technologie
Découvrez les crypto-baleines : qui fait quoi sur le marché
7 mai 2024
Orbiter Finance s'associe au réseau Bitcoin Layer 2 Zulu et se déploie sur Lwazi Testnet
La Brochure Rapport de nouvelles Technologie
Orbiter Finance s'associe au réseau Bitcoin Layer 2 Zulu et se déploie sur Lwazi Testnet 
7 mai 2024
Crypto Exchange Bybit intègre l'USDe d'Ethena Labs comme actif collatéral, permettant les paires de trading BTC-USDe et ETH-USDe
Marchés Rapport de nouvelles Technologie
Crypto Exchange Bybit intègre l'USDe d'Ethena Labs comme actif collatéral, permettant les paires de trading BTC-USDe et ETH-USDe
7 mai 2024
CRYPTOMERIA LABS PTE. LTD.