Relatório de notícias Tecnologia
31 de maio de 2023

Guanaco surge como potencial código-fonte aberto ChatGPT Concorrente

Em Breve

O Guanaco, um chatbot de código aberto desenvolvido por pesquisadores da Universidade de Washington, pretende competir com ChatGPT exigindo menos tempo e dinheiro para treinamento.

Um novo estudo, no entanto, questionou a eficácia de modelos como o Alpaca.

Pesquisadores da Universidade de Washington revelaram Guanaco, um chatbot de código aberto que visa rivalizar com o desempenho de ChatGPT ao mesmo tempo que reduz significativamente o tempo e os recursos necessários para o treinamento. Nomeado em homenagem a um parente sul-americano de llamas, Guanaco é construído sobre o LLaMA modelo de linguagem e incorpora um novo método de ajuste fino chamado QLoRA.

Guanaco surge como potencial código-fonte aberto ChatGPT Concorrente
Metaverse Post (mpost.io)

Os criadores do Guanaco afirmam que ele atinge um desempenho comparável ao ChatGPT mas pode ser treinado em apenas um único dia. Esse feito notável é possível graças ao QLoRA, uma técnica de ajuste fino do modelo de linguagem que reduz substancialmente a quantidade de memória da GPU necessária para o treinamento. Enquanto ChatGPT requer incríveis 780 GB de memória GPU para um modelo com 65 bilhões de parâmetros, a versão mais simples do Guanaco requer apenas 5 GB.

Com esses ganhos de eficiência impressionantes, o Guanaco e modelos semelhantes de código aberto estão desafiando a noção de que um treinamento caro é necessário para modelos de linguagem de última geração. O surgimento do Guanaco, Alpaca e outros modelos que treinam por uma fração do custo levou à especulação sobre o futuro de modelos caros como GPT.

No entanto, nem todos concordam com essa visão otimista dos modelos de código aberto. Um estudo recente conduzido pela Universidade da Califórnia lançou dúvidas sobre as capacidades de modelos como as alpacas e levantou questões sobre o seu verdadeiro potencial. Inicialmente, os pesquisadores chegaram a uma conclusão semelhante à dos criadores do Guanaco: quando devidamente treinados, os modelos de código aberto podem rivalizar GPT em capacidades. Testes adicionais revelaram uma limitação significativa. Esses modelos “Dolly”, como às vezes são chamados, são adeptos de imitar soluções para problemas encontrados durante o treinamento. No entanto, eles lutam para ter um bom desempenho em tarefas às quais não foram explicitamente expostos, ficando atrás de modelos mais avançados.

Esta revelação sugere que o milhões investidos em treinamento GPT e modelos semelhantes podem não ter sido em vão. Embora o Guanaco e seus equivalentes demonstrem resultados promissores, ainda existem áreas em que modelos mais sofisticados se destacam. Vale notar que o pesquisa realizada pela Universidade da Califórnia desafia a noção predominante de que modelos de código aberto podem substituir totalmente modelos caros como GPT.

À medida que o campo do processamento de linguagem natural evolui, será interessante observar como o Guanaco e outros modelos de código aberto se comparam aos já estabelecidos. referências como ChatGPT. A alta taxa de inovação e a pesquisa contínua irão, sem dúvida, impactar o futuro dos modelos de linguagem e determinar quais modelos se tornarão a escolha certa para aplicações específicas.

  • Dolly 2.0, o primeiro 12B Chat-LLM de código aberto comercialmente disponível, foi anunciado por Databricks. Este é um avanço significativo para o setor de aprendizado de máquina, permitindo que as empresas criem modelos de linguagem eficazes sem investir em clusters de GPU caros. A Databricks contratou 5,000 funcionários para criar seu modelo de linguagem de código aberto, que incluía o modelo de linguagem Pythia-12B da EleutherAI sob uma licença do MIT. O Dolly 2.0, assim como o código associado, está disponível sob uma licença do MIT. O Dolly 2.0 tem o potencial de mudar o setor e é um passo significativo para o aprendizado de máquina.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Cresce apetite institucional por ETFs de Bitcoin em meio à volatilidade

As divulgações por meio de registros 13F revelam investidores institucionais notáveis ​​​​que se envolvem em ETFs Bitcoin, ressaltando uma aceitação crescente de ...

Saber Mais

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Nexo inicia 'The Hunt' para recompensar usuários com US$ 12 milhões em tokens NEXO por se envolverem com seu ecossistema
Mercados Relatório de notícias Tecnologia
Nexo inicia 'The Hunt' para recompensar usuários com US$ 12 milhões em tokens NEXO por se envolverem com seu ecossistema
8 de maio de 2024
Revolut X Exchange da Revolut atrai comerciantes de criptografia com taxas zero de fabricante e análises avançadas
Mercados Software Histórias e resenhas Tecnologia
Revolut X Exchange da Revolut atrai comerciantes de criptografia com taxas zero de fabricante e análises avançadas
8 de maio de 2024
Plataforma de negociação de criptografia BitMEX estreia negociação de opções com 0 taxas e incentivos em dinheiro
O negócio Mercados Relatório de notícias
Plataforma de negociação de criptografia BitMEX estreia negociação de opções com 0 taxas e incentivos em dinheiro
8 de maio de 2024
Lisk faz transição oficial para Ethereum Layer 2 e revela Core v4.0.6
Relatório de notícias Tecnologia
Lisk faz transição oficial para Ethereum Layer 2 e revela Core v4.0.6
8 de maio de 2024
CRYPTOMERIA LABS PTE. LTDA.