Databricks anuncia Dolly, outro código aberto de “orçamento” ChatGPT Concorrente
Em Breve
Dolly é um clone da Alpaca criado pela Databricks para democratizar o acesso a grandes modelos de linguagem.
Ele pode ser treinado com uma pequena quantidade de informações, gastando apenas US$ 30 e 3 horas de trabalho.
Na semana passada, falou-se de um ChatGPTsemelhante ao chamado Alpaca, cujo treinamento custa centenas de vezes menos do que OpenAI modelos devido ao uso de informações sintéticas geradas usando GPT. Agora conheça Boneca, um clone da Alpaca com o nome de Dolly, a ovelha clone, cuja missão é democratizar o acesso a grandes modelos de linguagem. Programadores na Databricks dizer que Dolly pode ser treinado com uma pequena quantidade de informação por apenas US$ 30 e 3 horas de trabalho. Nesse caso, você não precisa de um supercomputador para várias dezenas de milhares de dólares.
Espera-se que Dolly seja um divisor de águas no campo do processamento de linguagem natural, pois permitirá que pequenas empresas e indivíduos desenvolvam seus próprios modelos de linguagem sem gastar muito. Essa democratização do acesso a grandes modelos de linguagem pode levar a um surto de inovação e criatividade no campo da IA.
Dolly foi criada com base no modelo 2020 Eleuter modelo de linguagem, que tem apenas 6 bilhões de parâmetros em comparação com 135 bilhões em GPT. O modelo antigo foi modificado com a ajuda das informações recebidas do Alpaca mencionadas acima, e foi alcançada a capacidade de seguir as instruções do usuário, o que não estava na versão original. Agora ele pode funcionar como um chatbot, gerar texto e fazer brainstorming sobre um determinado assunto.
Apesar de ter apenas 6 bilhões de parâmetros, o Dolly mostrou um desempenho impressionante em tarefas linguísticas e tem potencial para ser uma alternativa mais eficiente e econômica a modelos maiores, como GPT. Com maior desenvolvimento e treinamento, Dolly poderá se tornar uma ferramenta valiosa para aplicações de processamento de linguagem natural.
A partir disso, o Databricks assume que a frieza do mesmo ChatGPT está justamente na qualidade da informação sobre a qual o chatbot foi treinado e não no avanço técnico do próprio modelo. Afinal, Dolly, explicam os desenvolvedores, aprendeu habilidades semelhantes em muito pouco tempo, embora não em um nível tão alto. Isso destaca a importância de dados de treinamento de alta qualidade na construção de chatbots eficazes. Também sugere que os avanços técnicos no processamento de linguagem natural nem sempre são o fator chave para melhorar o desempenho do chatbot.
- OpenAI'S ChatGPT modelo de linguagem é adicionando novos plugins para expandir suas capacidades. Esses plug-ins conectar ChatGPT a aplicativos de terceiros, permitindo que ele recupere informações em tempo real e baseadas em conhecimento, além de realizar ações como reservar um voo ou pedir comida. Os desenvolvedores podem acessar a documentação para criar seus plug-ins e ChatGPT atua como um chamador de API inteligente usando a especificação de API e descrições de linguagem natural.
Leia mais tópicos relacionados:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.
Mais artigosDamir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.