Meta revela código aberto revolucionário LLaMa-2-Bate-papo com desempenho sem precedentes
Em Breve
Meta lançou LLaMaModelos -2-Chat, um grande avanço na IA de código aberto.
Esses modelos, com parâmetros 70B, são comparáveis a GPT-3.5 e superar os benchmarks.
Afinados usando RLHF, eles oferecem ChatGPT equivalentes, métricas de avaliação humana e capacidades de resolução de problemas matemáticos.
Meta recentemente lançou um conjunto de LLaMa-2-Modelos de bate-papo em vários tamanhos. Este lançamento do departamento LLM da GenAI criou um burburinho na indústria.
LLaMa-2-Chat é uma conquista verdadeiramente notável criada pela talentosa equipe do departamento LLM da GenAI. Com uma impressionante contagem de parâmetros de 70 bilhões, este modelo é comparável e até mesmo supera o altamente conceituado GPT-3.5 em determinados benchmarks.
Destaques:
- Comercial amigável
- Pré-treinado em tokens 2T
- Pontuações MMLU fortes (ou seja, raciocínio forte)
- contexto 4K
- (Extensível) Incorporações RoPE
- O desempenho da codificação é meh
- Versões de bate-papo SFT/RLHF
O fato de que LLaMa-2-Chat é o primeiro modelo desse tamanho a ser ajustado usando RLHF (Reinforcement Learning from Human Feedback) o que o torna ainda mais notável. Num movimento sem precedentes, a Meta tornou este modelo totalmente gratuito para uso comercial. Os interessados podem solicitar o link para download em seu site oficial.
Uma das vantagens mais significativas de LLaMa-2-Chat é o seu potencial para criar ChatGPT análogos sem a necessidade de compartilhar quaisquer dados com OpenAI. Isso capacita desenvolvedores e pesquisadores a aproveitar o poder do modelo, mantendo controle total sobre seus dados. Você pode download novo modelo aqui.
ENORMES NOTÍCIAS DE IA!!!🔥Llama 2 acabaram de sair! E adivinha? É totalmente de código aberto e pode ser usado para fins comerciais!!! Os parâmetros 7-70B são suportados.
- Aleksa Gordić 🍿🤖 (@gordic_aleksa) 18 de julho de 2023
Eles também lançam variantes ajustadas e otimizadas para casos de uso de diálogo (LLaMA 2-Bate-papo)!
O papel parece super detalhado – 76… pic.twitter.com/yZahl7Jzya
Em termos de métricas de avaliação humana, LLaMa-2-Chat fica ombro a ombro com ChatGPT-3,5 em termos de qualidade. Notavelmente, apresenta desempenho excepcional em problemas matemáticos, superando outros modelos neste domínio.
- Em fevereiro, Meta lançou LLaMA modelo, um grande modelo de linguagem projetado para apoiar pesquisadores de IA. Disponível em vários tamanhos (parâmetros 7B, 13B, 33B e 65B), LLaMA permite pesquisadores para testar novas abordagens e explore novos casos de uso. O modelo é ideal para tarefas de ajuste fino e é construído sobre um grande conjunto de dados não rotulados. Apesar de sua versatilidade, LLaMA enfrenta riscos de preconceito, comentários tóxicos e alucinações. O modelo é lançado sob uma licença não comercial focada em casos de uso de pesquisa, e a elegibilidade para acesso é avaliada caso a caso.
- A LLaMa modelo, com 7 bilhões de parâmetros, alcançou inferência extremamente rápida em um MacBook com o chip M2 Max. Essa conquista foi possível graças à implementação bem-sucedida de inferência de modelo por Greganov no Metal GPU, um acelerador especializado encontrado nos chips mais recentes da Apple. O LLaMa modelo demonstra 0% de utilização da CPU, aproveitando o poder de processamento de todos os 38 núcleos Metal. Esta visão de assistência personalizada de IA e localização em dispositivos pessoais tem um imenso potencial para um futuro onde a IA se torne parte integrante da vida das pessoas, fornecendo assistência personalizada e agilizando tarefas rotineiras.
Leia mais sobre IA:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.
Mais artigosDamir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.