Relatório de notícias Equipar
05 de Junho de 2023

LLaMa com 7 bilhões de parâmetros alcança inferência extremamente rápida no chip Apple M2 Max

Em Breve

LLaMa o modelo funciona a 40 tokens por segundo no chip M2 Max, demonstrando 0% de utilização da CPU, despertando a imaginação de entusiastas e usuários de IA.

Os modelos de IA podem ser adaptados às necessidades individuais e executados localmente em dispositivos pessoais, fornecendo assistência personalizada e agilizando as tarefas de rotina.

Uma conquista inovadora no campo da IA ​​foi revelada como o LLaMa modelo com surpreendentes 7 bilhões de parâmetros agora roda a uma velocidade impressionante de 40 tokens por segundo em um MacBook equipado com o chip M2 Max de última geração. Essa façanha notável foi possível por meio de uma atualização recente no repositório GIT por Greganov, que implementou com sucesso a inferência de modelo no GPU de metal, um acelerador especializado encontrado nos chips mais recentes da Apple.

LLaMa com 7 bilhões de parâmetros alcança inferência extremamente rápida no chip Apple M2 Max
Crédito: Metaverse Post (mpost.io)
Recomendado: Guanaco surge como potencial código-fonte aberto ChatGPT Concorrente

A implementação da inferência de modelo na GPU Metal produziu resultados extraordinários. Utilizando este hardware especial, o LLaMa O modelo demonstra uma utilização surpreendente de CPU de 0%, aproveitando efetivamente o poder de processamento de todos os 38 núcleos Metal. Esta conquista não só demonstra as capacidades do modelo, mas também destaca a habilidade e experiência excepcionais de Greganov como um engenheiro notável.

As implicações deste desenvolvimento são de longo alcance, despertando a imaginação tanto dos entusiastas como dos utilizadores da IA. Com personalizado LLaMa modelos executados localmente, as tarefas rotineiras poderiam ser gerenciadas sem esforço por indivíduos, inaugurando uma nova era de modularização. O conceito gira em torno de um modelo massivo treinado centralmente, que é então ajustado e personalizado por cada usuário em seus dados pessoais, resultando em um assistente de IA altamente personalizado e eficiente.

A visão de ter um atendimento personalizado LLaMa modelo que auxilia indivíduos em assuntos cotidianos tem um potencial imenso. Ao localizar o modelo em dispositivos pessoais, os usuários podem experimentar os benefícios da poderosa IA enquanto mantendo o controle sobre seus dados. Essa localização também garante tempos de resposta rápidos, permitindo interações rápidas e contínuas com o assistente de IA.

A combinação de tamanhos de modelos massivos e inferência eficiente em hardware especializado abre caminho para um futuro em que a IA se torne parte integrante da vida das pessoas, fornecendo assistência personalizada e agilizando tarefas rotineiras.

Avanços como estes aproximam-nos de um mundo onde os modelos de IA podem ser adaptados às necessidades individuais e executados localmente em dispositivos pessoais. Com cada usuário tendo a capacidade de refinar e otimizar seus LLaMa modelo baseado em seus dados exclusivos, o potencial de eficiência e produtividade impulsionadas pela IA é ilimitado.

As conquistas testemunhadas no LLaMa o desempenho do modelo no chip Apple M2 Max serve como uma prova do Progresso rápido sendo feito em pesquisa e desenvolvimento de IA. Com engenheiros dedicados como Greganov ultrapassando os limites do que é possível, o futuro promete soluções personalizadas, eficientes e administradas localmente Modelos de IA que vão transformar o jeito interagimos com a tecnologia.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Morph apresenta sua rede de teste Holesky com integração zkEVM otimista, mecanismo de ponte e recursos de rede de sequenciador descentralizado
Relatório de notícias Equipar
Morph apresenta sua rede de teste Holesky com integração zkEVM otimista, mecanismo de ponte e recursos de rede de sequenciador descentralizado
6 de maio de 2024
Robinhood Crypto recebe aviso de poços da Comissão de Valores Mobiliários sobre supostas violações de títulos
Mercados Relatório de notícias Equipar
Robinhood Crypto recebe aviso de poços da Comissão de Valores Mobiliários sobre supostas violações de títulos
6 de maio de 2024
QuickSwap é implantado na rede principal X Layer e expande a rede Polygon CDK com o lançamento do Citadel
Relatório de notícias Equipar
QuickSwap é implantado na rede principal X Layer e expande a rede Polygon CDK com o lançamento do Citadel 
6 de maio de 2024
Camada 2 Network Linea inicia reivindicação de token ZERO da ZeroLend Airdrop Usuários e investidores
Mercados Relatório de notícias Equipar
Camada 2 Network Linea inicia reivindicação de token ZERO da ZeroLend Airdrop Usuários e investidores
6 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.