Rapport de nouvelles Technologie
24 février 2023

Méta-versions LLaMA: Un modèle de langage fondamental de pointe pour la recherche en IA

En bref

Meta a annoncé la sortie d'un nouveau grand modèle de langage appelé LLaMA, conçu pour aider les chercheurs en IA à faire progresser leurs travaux dans le domaine de l'IA.

LLaMA est disponible en plusieurs tailles, allant des paramètres 7B à 65B, et est conçu pour être polyvalent.

objectif llama

Méta a libéré un nouveau grand modèle de langage appelé LLaMA (Large Language Model Meta AI) pour soutenir les chercheurs en IA. Le modèle permettra à davantage de personnes dans la communauté des chercheurs d'étudier modèles de langage et faciliter l'accès à ce domaine important.

LLaMA est disponible en plusieurs tailles (paramètres 7B, 13B, 33B et 65B). En formant des modèles de fondations plus petits comme LLaMA, les chercheurs peuvent utiliser moins de puissance de calcul et de ressources pour tester de nouvelles approches et explorer de nouveaux cas d'utilisation. Meta a écrit que LLaMA est idéal pour affiner une variété de tâches car il s'entraîne sur un large ensemble de données non étiquetées. Meta prétend s'engager en faveur de pratiques d'IA responsables et partage un LLAMA modèle carte qui détaille comment le modèle a été construit.

Développer LLaMA, Meta a sélectionné des textes dans les 20 langues les plus parlées, en se concentrant sur les langues utilisant les alphabets latin et cyrillique. Ce grand modèle de langage génère du texte en prenant une séquence de mots en entrée et en prédisant le mot suivant de manière récursive, à l'instar d'autres modèles de cette catégorie.

« En tant que modèle de base, LLaMA est conçu pour être polyvalent et peut être appliqué à de nombreux cas d’utilisation différents, par rapport à un modèle affiné conçu pour une tâche spécifique. En partageant le code pour LLaMA, autre les chercheurs peuvent plus facilement tester de nouvelles approches limiter ou éliminer ces problèmes dans les grands modèles de langage »,

Meta a écrit.

L'entreprise admet qu'elle doit encore faire face aux risques de biais, de commentaires toxiques et d'hallucinations en grande partie modèles de langage, dont LLaMA.

Meta publie le modèle sous une licence non commerciale axée sur les cas d'utilisation de la recherche "pour maintenir l'intégrité et prévenir les abus". Les individus et les organisations souhaitant accéder au modèle seront évalués au cas par cas. Les parties éligibles comprennent les chercheurs universitaires, les organisations gouvernementales et de la société civile, ainsi que les laboratoires de recherche industriels du monde entier.

Vous pouvez lire un article entier sur LLaMA ici. Si éligible, vous pouvez également vous inscrire pour tester le modèle de langage.

Lire la suite:

Mots clés:

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Agne est une journaliste qui couvre les dernières tendances et développements dans le métaverse, l'IA et Web3 industries pour la Metaverse Post. Sa passion pour la narration l'a amenée à mener de nombreux entretiens avec des experts dans ces domaines, cherchant toujours à découvrir des histoires passionnantes et engageantes. Agne est titulaire d'un baccalauréat en littérature et possède une vaste expérience en rédaction sur un large éventail de sujets, notamment les voyages, l'art et la culture. Elle s'est également portée volontaire en tant que rédactrice pour une organisation de défense des droits des animaux, où elle a contribué à sensibiliser les gens aux problèmes de bien-être animal. Contactez-la au [email protected].

Plus d'articles
Agne Cimerman
Agne Cimerman

Agne est une journaliste qui couvre les dernières tendances et développements dans le métaverse, l'IA et Web3 industries pour la Metaverse Post. Sa passion pour la narration l'a amenée à mener de nombreux entretiens avec des experts dans ces domaines, cherchant toujours à découvrir des histoires passionnantes et engageantes. Agne est titulaire d'un baccalauréat en littérature et possède une vaste expérience en rédaction sur un large éventail de sujets, notamment les voyages, l'art et la culture. Elle s'est également portée volontaire en tant que rédactrice pour une organisation de défense des droits des animaux, où elle a contribué à sensibiliser les gens aux problèmes de bien-être animal. Contactez-la au [email protected].

La frénésie DOGE : analyse de la récente hausse de valeur de Dogecoin (DOGE)

L’industrie des crypto-monnaies se développe rapidement et les pièces meme se préparent à une reprise significative. Dogecoin (DOGE), ...

En savoir plus

L'évolution du contenu généré par l'IA dans le métaverse

L'émergence du contenu génératif de l'IA est l'un des développements les plus fascinants de l'environnement virtuel...

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Les meilleures offres de la semaine, les investissements majeurs dans l'IA, l'informatique, Web3, et Crypto (22-26.04)
Digérer La Brochure Marchés Technologie
Les meilleures offres de la semaine, les investissements majeurs dans l'IA, l'informatique, Web3, et Crypto (22-26.04)
26 avril 2024
Vitalik Buterin commente la centralisation du PoW et note qu'il s'agissait d'une étape temporaire jusqu'au PoS
Rapport de nouvelles Technologie
Vitalik Buterin commente la centralisation du PoW et note qu'il s'agissait d'une étape temporaire jusqu'au PoS
26 avril 2024
Offchain Labs révèle la découverte de deux vulnérabilités critiques dans les preuves de fraude de la pile OP d'Optimism
Rapport de nouvelles Logiciels Technologie
Offchain Labs révèle la découverte de deux vulnérabilités critiques dans les preuves de fraude de la pile OP d'Optimism
26 avril 2024
Le marché ouvert de Dymension pour combler les liquidités de RollApps eIBC est lancé sur le réseau principal
Rapport de nouvelles Technologie
Le marché ouvert de Dymension pour combler les liquidités de RollApps eIBC est lancé sur le réseau principal 
26 avril 2024
CRYPTOMERIA LABS PTE. LTD.