Relatório de notícias Equipar
02 de maio de 2023

MLCopilot: aproveite o poder dos LLMs para ajudar os desenvolvedores em suas tarefas de ML

Em Breve

MLCopilot é uma nova forma de usar modelos de aprendizado de máquina para resolver tarefas desafiadoras, automatizando o processo de seleção de parâmetros e arquiteturas.

Ele opera em dois níveis, offline e online, extraindo conhecimento de centenas de experimentos de aprendizado de máquina e aplicando um prompt especial para gerar uma decisão.

Ele fornece benefícios tangíveis, como velocidade de execução e redução de custos de mão de obra.

Modelos de aprendizado de máquina têm sido usados ​​para resolver diversas tarefas; no entanto, treiná-los tem sido principalmente um processo manual. O desafio foi selecionar os parâmetros e arquiteturas corretos para obter os melhores resultados, uma vez que o processo requer considerável know-how e experiência. Com o advento de tecnologias avançadas e grandes modelos de linguagem (LLM), como GPT-3.5, esse processo agora pode ser automatizado. Isso abre uma nova maneira de usar o poder dos modelos de aprendizado de máquina na resolução de tarefas desafiadoras: MLCopilot.

MLCopilot: aproveite o poder dos LLMs para ajudar os desenvolvedores em suas tarefas de ML
@Midjourney /roypolloi#4804
Leia mais: 8 coisas que você deve saber sobre modelos de linguagem grandes

ML Piloto opera em dois níveis. No lado offline, entidades como a arquitetura de intenção e modelo são unificadas, com conhecimento extraído de centenas de experimentos de aprendizado de máquina. Esses dados formam a base de conhecimento sobre a qual o MLCopilot trabalha. No lado online, o MLCopilot aplica um prompt especial, incluindo exemplos relevantes de experimentos anteriores, para gerar uma decisão sobre a melhor abordagem para resolver uma determinada tarefa. Essas decisões foram consideradas mais precisas do que aquelas feitas por pessoas que selecionam e aplicam manualmente algoritmos testados e comprovados.

Um prompt específico é direcionado on-line em GPT-3.5
Um prompt específico é colocado on-line em GPT-3.5 (nem mesmo ChatGPT, e menos ainda o GPT-4), e amostras adequadas de trabalhos semelhantes são automaticamente colocadas nele. O assistente então toma uma decisão sobre como e o que fazer. Seguindo as instruções, os usuários produziram modelos treinados com qualidade superior aos métodos propostos anteriormente e especialmente adaptados (por exemplo, enumeração inteligente de parâmetros em vez de aleatória).

Além de tomar decisões mais precisas, o MLCopilot oferece benefícios tangíveis como velocidade de execução e redução de custos de mão de obra. Por outro lado, algumas desvantagens devem ser lembradas, por exemplo, a necessidade de dados de alta precisão para formar a base de conhecimento e a necessidade de manter o modelo atualizado com novos experimentos.

Curiosamente, as estimativas de experimentos da história foram traduzidas em valores relativos sem números: “muito baixo”, “baixo”, “médio”, “alto” e “muito alto”. Com base nisso, o modelo pode determinar o que funciona e o que não funciona.

O modelo tem acesso a centenas de milhares desses fatos por meio de uma memória externa (Retriever) e se propõe a experimentar novos dados e tarefas com base nessas conclusões generalizadas.
O modelo tem acesso a centenas de milhares desses fatos por meio de uma memória externa (Retriever); propõe experimentar novos dados e tarefas com base nessas conclusões generalizadas.

No geral, o MLCopilot tem o potencial de melhorar a maneira como as tarefas de aprendizado de máquina são resolvidas. Ao selecionar automaticamente os parâmetros e a arquitetura corretos, ele nos permite aproveitar o poder dos modelos de aprendizado de máquina para economizar tempo e custo, melhorando a precisão. Em última análise, esses benefícios beneficiarão a todos: de pesquisadores individuais a grandes corporações ou organizações estatais. Este é um grande salto para a era da IA ​​e certamente será seguido por desenvolvimentos mais emocionantes.

O artigo termina com uma nota assustadora para alguns e uma nota motivadora para outros: “Esperamos que o design de nosso método possa servir de inspiração para a comunidade em geral e contribuir para o avanço dos LLMs em direção ao objetivo de alcançar a inteligência artificial geral ( IAG).”

  • Em março 14, OpenAI anunciou o lançamento de GPT-4, uma versão atualizada de seu modelo de inteligência artificial GPT-3.5. Alcançou um limite de alto grau, superando GPT-3.5 em vários benchmarks de estudo.

Leia mais sobre IA:

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

O frenesi DOGE: analisando o recente aumento de valor do Dogecoin (DOGE)

A indústria de criptomoedas está se expandindo rapidamente e as moedas meme estão se preparando para um aumento significativo. Dogecoin (DOGE), ...

Saber Mais

A evolução do conteúdo gerado por IA no metaverso

O surgimento de conteúdo generativo de IA é um dos desenvolvimentos mais fascinantes dentro do ambiente virtual...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
As principais ofertas desta semana, grandes investimentos em IA, TI, Web3e criptografia (22-26.04)
Digerir O negócio Mercados Equipar
As principais ofertas desta semana, grandes investimentos em IA, TI, Web3e criptografia (22-26.04)
26 de abril de 2024
Vitalik Buterin comenta sobre centralização do PoW, observa que era um estágio temporário até o PoS
Relatório de notícias Equipar
Vitalik Buterin comenta sobre centralização do PoW, observa que era um estágio temporário até o PoS
26 de abril de 2024
Offchain Labs revela descoberta de duas vulnerabilidades críticas nas provas de fraude do OP Stack do Optimism
Relatório de notícias Software Equipar
Offchain Labs revela descoberta de duas vulnerabilidades críticas nas provas de fraude do OP Stack do Optimism
26 de abril de 2024
Mercado aberto da Dymension para aumentar a liquidez da RollApps eIBC é lançado na rede principal
Relatório de notícias Equipar
Mercado aberto da Dymension para aumentar a liquidez da RollApps eIBC é lançado na rede principal 
26 de abril de 2024
CRYPTOMERIA LABS PTE. LTDA.