Databricks publica Dolly 2.0, o primeiro 12B Chat-LLM de código aberto comercialmente disponível
Em Breve
A Databricks anunciou o lançamento do Dolly 2.0 como o primeiro 12B Chat-LLM de código aberto comercialmente disponível, permitindo que as empresas criem modelos de linguagem poderosos sem investir em clusters de GPU caros.
Databricks tem anunciou o lançamento do Dolly 2.0 como o primeiro 12B Chat-LLM de código aberto comercialmente disponível. O Dolly é um grande avanço para o setor de aprendizado de máquina, permitindo que as empresas criem modelos de linguagem poderosos, como LLMs autorregressivos com suporte a diálogos, sem precisar investir em clusters de GPU caros.
Para obter o seu modelo de linguagem de código aberto, a Databricks precisava de um conjunto de dados grande e de alta qualidade. Depois de considerar inicialmente o Alpaca GPT-3 conjunto de dados e outros conjuntos de dados de código aberto que não permitem uso comercial, eles decidiram construir seu próprio conjunto de dados de alta qualidade. Para isso, empregaram 5,000 pessoas e pediram-lhes que escrevessem vários exemplos que seriam usados para treinar um LLM autorregressivo capaz de simplesmente continuar o texto e não conduzir um diálogo. Com a ajuda de grandes incentivos, como bônus por escrever os melhores exemplos, eles conseguiram reunir um impressionante 15,000 conjuntos de dados de amostra.
Databricks deu o próximo passo e incorporou EleutherAI's Pítia-12B modelo de linguagem com uma licença do MIT e o retreinou em seu próprio conjunto de dados, resultando no Dolly 2.0. O Dolly 2.0 foi lançado sob uma licença do MIT, junto com o código que o acompanha. Com o lançamento do Dolly 2.0, o setor de aprendizado de máquina agora tem uma ferramenta poderosa para criar modelos de linguagem robustos de maneira econômica. Isso pode ser utilizado por empresas e indivíduos que desejam criar aplicativos poderosos que possam entender e processar linguagem complexa.
Ao todo, o lançamento de Boneca 2.0 como o primeiro 12B Chat-LLM de código aberto disponível comercialmente, é um marco significativo para o setor de aprendizado de máquina. Aproveitando a licença do MIT e criando seu próprio conjunto de dados de alta qualidade, o Databricks tornou modelos de linguagem poderosos acessíveis a empresas e indivíduos. O Dolly 2.0 pretende revolucionar a indústria e é um grande passo para o aprendizado de máquina.
Os usuários agora estão esperando que os desenvolvedores quantizem o Dolly em 4 bits e o acelerem para rodar na CPU, bem como uma resposta do OpenAssistant, que deve fornecer seu modelo nos próximos dias.
- A NTIA está solicitando comentários públicos sobre possíveis regulamentações que regular os sistemas de IA como ChatGPT para ajudar o governo Biden a garantir que funcionem conforme prometido. A NTIA divulgou uma declaração sobre a criação de regras de responsabilidade da IA, o que pode evitar contratempos futuros e minimizar os riscos de ameaças hipotéticas.
Leia mais sobre IA:
Aviso Legal
Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.
Sobre o autor
Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.
Mais artigosDamir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet.