Relatório de notícias Equipar
24 de fevereiro de 2023

Metalançamentos LLaMA: Um modelo de linguagem fundamental de última geração para pesquisa em IA

Em Breve

Meta anunciou o lançamento de um novo modelo de linguagem grande chamado LLaMA, projetado para ajudar os pesquisadores de IA a avançar em seu trabalho no campo da IA.

LLaMA está disponível em vários tamanhos, variando de parâmetros 7B a 65B, e foi projetado para ser versátil.

objetivo llama

Meta tem liberado um novo modelo de linguagem grande chamado LLaMA (Large Language Model Meta AI) para apoiar pesquisadores de IA. O modelo permitirá que mais pessoas na comunidade de pesquisa estudem modelos de linguagem e facilitar o acesso a este importante campo.

LLaMA está disponível em vários tamanhos (parâmetros 7B, 13B, 33B e 65B). Ao treinar modelos de fundação menores, como LLaMA, os pesquisadores podem usar menos poder e recursos computacionais para testar novas abordagens e explorar novos casos de uso. Meta escreveu isso LLaMA é ideal para ajustar uma variedade de tarefas, pois treina em um grande conjunto de dados não rotulados. Meta afirma estar comprometida com práticas responsáveis ​​de IA e compartilha um LLAMA modelo cartão que detalha como o modelo foi construído.

Desenvolver LLaMA, Meta selecionou textos das 20 línguas mais faladas, com foco em línguas que usam os alfabetos latino e cirílico. Este grande modelo de linguagem gera texto tomando uma sequência de palavras como entrada e prevendo a próxima palavra recursivamente, semelhante a outros modelos nesta categoria.

“Como modelo de base, LLaMA foi projetado para ser versátil e pode ser aplicado a muitos casos de uso diferentes, em vez de um modelo ajustado projetado para uma tarefa específica. Ao compartilhar o código para LLaMA, de outros os pesquisadores podem testar mais facilmente novas abordagens para limitar ou eliminar esses problemas em grandes modelos de linguagem”,

Meta escreveu.

A empresa admite que ainda precisa lidar com os riscos de preconceito, comentários tóxicos e alucinações em grandes modelos de linguagem, incluindo LLaMA.

A Meta está lançando o modelo sob uma licença não comercial focada em casos de uso de pesquisa “para manter a integridade e evitar o uso indevido”. Indivíduos e organizações que buscam acesso ao modelo serão avaliados caso a caso. As partes elegíveis incluem pesquisadores acadêmicos, organizações governamentais e da sociedade civil e laboratórios de pesquisa da indústria em todo o mundo.

Você pode ler um artigo inteiro em LLaMA SUA PARTICIPAÇÃO FAZ A DIFERENÇA. Se elegível, você também pode Aplique para testar o modelo de linguagem.

Leia mais:

Tags:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Agne é uma jornalista que cobre as últimas tendências e desenvolvimentos no metaverso, IA e Web3 indústrias para o Metaverse Post. Sua paixão por contar histórias a levou a realizar inúmeras entrevistas com especialistas nessas áreas, sempre buscando descobrir histórias emocionantes e envolventes. Agne é bacharel em literatura e possui ampla experiência em redação sobre uma ampla variedade de tópicos, incluindo viagens, arte e cultura. Ela também foi voluntária como editora da organização de direitos dos animais, onde ajudou a aumentar a conscientização sobre questões de bem-estar animal. Entre em contato com ela [email protegido].

Mais artigos
Agne Cimerman
Agne Cimerman

Agne é uma jornalista que cobre as últimas tendências e desenvolvimentos no metaverso, IA e Web3 indústrias para o Metaverse Post. Sua paixão por contar histórias a levou a realizar inúmeras entrevistas com especialistas nessas áreas, sempre buscando descobrir histórias emocionantes e envolventes. Agne é bacharel em literatura e possui ampla experiência em redação sobre uma ampla variedade de tópicos, incluindo viagens, arte e cultura. Ela também foi voluntária como editora da organização de direitos dos animais, onde ajudou a aumentar a conscientização sobre questões de bem-estar animal. Entre em contato com ela [email protegido].

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

O frenesi DOGE: analisando o recente aumento de valor do Dogecoin (DOGE)

A indústria de criptomoedas está se expandindo rapidamente e as moedas meme estão se preparando para um aumento significativo. Dogecoin (DOGE), ...

Saber Mais

A evolução do conteúdo gerado por IA no metaverso

O surgimento de conteúdo generativo de IA é um dos desenvolvimentos mais fascinantes dentro do ambiente virtual...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
As principais ofertas desta semana, grandes investimentos em IA, TI, Web3e criptografia (22-26.04)
Digerir O negócio Mercados Equipar
As principais ofertas desta semana, grandes investimentos em IA, TI, Web3e criptografia (22-26.04)
26 de abril de 2024
Vitalik Buterin comenta sobre centralização do PoW, observa que era um estágio temporário até o PoS
Relatório de notícias Equipar
Vitalik Buterin comenta sobre centralização do PoW, observa que era um estágio temporário até o PoS
26 de abril de 2024
Offchain Labs revela descoberta de duas vulnerabilidades críticas nas provas de fraude do OP Stack do Optimism
Relatório de notícias Software Equipar
Offchain Labs revela descoberta de duas vulnerabilidades críticas nas provas de fraude do OP Stack do Optimism
26 de abril de 2024
Mercado aberto da Dymension para aumentar a liquidez da RollApps eIBC é lançado na rede principal
Relatório de notícias Equipar
Mercado aberto da Dymension para aumentar a liquidez da RollApps eIBC é lançado na rede principal 
26 de abril de 2024
CRYPTOMERIA LABS PTE. LTDA.