Relatório de notícias Tecnologia
10 de outubro de 2023

Microsoft forçou LLMs a esquecer Harry Potter

Microsoft forçou LLMs a esquecer Harry Potter
Fonte: Dall-E3

A Microsoft revelou um método para instruir Large Language Models (LLMs) a esquecer informações específicas em seus conjuntos de dados sem exigir uma reconstrução completa dos dados de treinamento. Este método abre novas possibilidades para melhorar os LLMs e potencialmente resolver questões legais envolvendo conteúdo protegido por direitos autorais.

A equipe da Microsoft demonstrou recentemente como foi capaz de tornar o Llama-2 modelo esquece os detalhes dos livros de Harry Potter sem afetar outros dados nos dados de treinamento do modelo ou o desempenho geral do modelo em um estudo descrito na página do projeto de pesquisa.

O processo começa com a identificação de informações específicas no conjunto de dados do modelo que precisam ser esquecidas. Nesse caso, foram detalhes relacionados à série icônica de JK Rowling, incluindo detalhes da trama, nomes de personagens e citações famosas. Estas foram então sistematicamente substituídas por frases genéricas e não relacionadas.

Os pesquisadores então empregaram um modelo de linguagem para gerar novas informações com base nesses dados genéricos. Esses novos dados foram então usados ​​para treinar novamente o original Llama-2 modelo incrementalmente. A cada passo, a modelo se distanciava dos livros de Harry Potter até começar a produzir respostas alucinatórias quando questionada sobre eles.

Uma característica marcante desta abordagem é que ela não compromete o desempenho geral do modelo. Isto significa que, embora o LLM se torne cada vez mais esquecido em relação a dados específicos, as suas capacidades linguísticas globais permanecem intactas.

Apesar de esta abordagem ainda estar em fase de aperfeiçoamento, as suas implicações são amplas. Em situações que envolvem ações judiciais e questões de direitos autorais, em particular, pode fornecer uma tábua de salvação para aqueles que criam LLMs e outros modelos de IA.

Esta inovação surge num momento em que aumentam as disputas legais sobre a utilização de conteúdos protegidos por direitos de autor em modelos de IA. Por exemplo, O New York Times exigiu recentemente a remoção de suas publicações do GPT-4 conjunto de dados. No caso de um sucesso desafio legal, os desenvolvedores normalmente precisariam reconstruir seus conjuntos de dados de modelo, um processo demorado e que consome muitos recursos. O método da Microsoft, se for aperfeiçoado e adotado, poderá fornecer uma solução eficiente para tais desafios.

O método da Microsoft para esquecer seletivamente informações específicas em modelos de linguagem grande (LLMs) é um avanço significativo no desenvolvimento da IA, potencialmente abordando questões de conteúdo protegido por direitos autorais e simplificando o refinamento. Esta abordagem poderia ser aplicada a vários domínios, demonstrando o desenvolvimento e a aplicação responsáveis ​​da IA.

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Do Ripple ao Big Green DAO: como os projetos de criptomoeda contribuem para a caridade

Vamos explorar iniciativas que aproveitem o potencial das moedas digitais para causas beneficentes.

Saber Mais

AlphaFold 3, Med-Gemini e outros: A maneira como a IA transforma a saúde em 2024

A IA se manifesta de várias maneiras na área da saúde, desde a descoberta de novas correlações genéticas até o fortalecimento de sistemas cirúrgicos robóticos...

Saber Mais
Saiba Mais
Saiba mais
Layer N revela N1 Layer1 Blockchain para impulsionar a próxima geração de aplicativos
Relatório de notícias Tecnologia
Layer N revela N1 Layer1 Blockchain para impulsionar a próxima geração de aplicativos
5 de dezembro de 2024
Por dentro da missão do BuzzUp de simplificar os pagamentos criptográficos e aprimorar as conexões sociais em Web3
Entrevista O negócio Estilo de vida Software Tecnologia
Por dentro da missão do BuzzUp de simplificar os pagamentos criptográficos e aprimorar as conexões sociais em Web3
5 de dezembro de 2024
CARV se une à Mind Network para integrar FHE para geração segura de números aleatórios
Relatório de notícias Tecnologia
CARV se une à Mind Network para integrar FHE para geração segura de números aleatórios
5 de dezembro de 2024
O custo oculto do gratuito: por que é difícil encontrar informações de qualidade
Opinião Estilo de vida Software Tecnologia
O custo oculto do gratuito: por que é difícil encontrar informações de qualidade
5 de dezembro de 2024
CRYPTOMERIA LABS PTE. LTDA.