Relatório de notícias Tecnologia
18 de julho de 2023

Meta revela código aberto revolucionário LLaMa-2-Bate-papo com desempenho sem precedentes

Em Breve

Meta lançou LLaMaModelos -2-Chat, um grande avanço na IA de código aberto.

Esses modelos, com parâmetros 70B, são comparáveis ​​a GPT-3.5 e superar os benchmarks.

Afinados usando RLHF, eles oferecem ChatGPT equivalentes, métricas de avaliação humana e capacidades de resolução de problemas matemáticos.

Meta recentemente lançou um conjunto de LLaMa-2-Modelos de bate-papo em vários tamanhos. Este lançamento do departamento LLM da GenAI criou um burburinho na indústria.

Meta revela código aberto revolucionário LLaMa-2-Bate-papo com desempenho sem precedentes
Crédito: Metaverse Post (mpost.io)

LLaMa-2-Chat é uma conquista verdadeiramente notável criada pela talentosa equipe do departamento LLM da GenAI. Com uma impressionante contagem de parâmetros de 70 bilhões, este modelo é comparável e até mesmo supera o altamente conceituado GPT-3.5 em determinados benchmarks.

Destaques:

  • Comercial amigável
  • Pré-treinado em tokens 2T
  • Pontuações MMLU fortes (ou seja, raciocínio forte)
  • contexto 4K
  • (Extensível) Incorporações RoPE
  • O desempenho da codificação é meh
  • Versões de bate-papo SFT/RLHF

O fato de que LLaMa-2-Chat é o primeiro modelo desse tamanho a ser ajustado usando RLHF (Reinforcement Learning from Human Feedback) o que o torna ainda mais notável. Num movimento sem precedentes, a Meta tornou este modelo totalmente gratuito para uso comercial. Os interessados ​​​​podem solicitar o link para download em seu site oficial.

Uma das vantagens mais significativas de LLaMa-2-Chat é o seu potencial para criar ChatGPT análogos sem a necessidade de compartilhar quaisquer dados com OpenAI. Isso capacita desenvolvedores e pesquisadores a aproveitar o poder do modelo, mantendo controle total sobre seus dados. Você pode download novo modelo aqui.

Em termos de métricas de avaliação humana, LLaMa-2-Chat fica ombro a ombro com ChatGPT-3,5 em termos de qualidade. Notavelmente, apresenta desempenho excepcional em problemas matemáticos, superando outros modelos neste domínio.

  • Em fevereiro, Meta lançou LLaMA modelo, um grande modelo de linguagem projetado para apoiar pesquisadores de IA. Disponível em vários tamanhos (parâmetros 7B, 13B, 33B e 65B), LLaMA permite pesquisadores para testar novas abordagens e explore novos casos de uso. O modelo é ideal para tarefas de ajuste fino e é construído sobre um grande conjunto de dados não rotulados. Apesar de sua versatilidade, LLaMA enfrenta riscos de preconceito, comentários tóxicos e alucinações. O modelo é lançado sob uma licença não comercial focada em casos de uso de pesquisa, e a elegibilidade para acesso é avaliada caso a caso.
  • A LLaMa modelo, com 7 bilhões de parâmetros, alcançou inferência extremamente rápida em um MacBook com o chip M2 Max. Essa conquista foi possível graças à implementação bem-sucedida de inferência de modelo por Greganov no Metal GPU, um acelerador especializado encontrado nos chips mais recentes da Apple. O LLaMa modelo demonstra 0% de utilização da CPU, aproveitando o poder de processamento de todos os 38 núcleos Metal. Esta visão de assistência personalizada de IA e localização em dispositivos pessoais tem um imenso potencial para um futuro onde a IA se torne parte integrante da vida das pessoas, fornecendo assistência personalizada e agilizando tarefas rotineiras.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Nexo inicia 'The Hunt' para recompensar usuários com US$ 12 milhões em tokens NEXO por se envolverem com seu ecossistema
Mercados Relatório de notícias Tecnologia
Nexo inicia 'The Hunt' para recompensar usuários com US$ 12 milhões em tokens NEXO por se envolverem com seu ecossistema
8 de maio de 2024
Revolut X Exchange da Revolut atrai comerciantes de criptografia com taxas zero de fabricante e análises avançadas
Mercados Software Histórias e resenhas Tecnologia
Revolut X Exchange da Revolut atrai comerciantes de criptografia com taxas zero de fabricante e análises avançadas
8 de maio de 2024
Plataforma de negociação de criptografia BitMEX estreia negociação de opções com 0 taxas e incentivos em dinheiro
O negócio Mercados Relatório de notícias
Plataforma de negociação de criptografia BitMEX estreia negociação de opções com 0 taxas e incentivos em dinheiro
8 de maio de 2024
Lisk faz transição oficial para Ethereum Layer 2 e revela Core v4.0.6
Relatório de notícias Tecnologia
Lisk faz transição oficial para Ethereum Layer 2 e revela Core v4.0.6
8 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.