Relatório de notícias Equipar
10 de outubro de 2023

Microsoft forçou LLMs a esquecer Harry Potter

Microsoft forçou LLMs a esquecer Harry Potter
Fonte: Dall-E3

A Microsoft revelou um método para instruir Large Language Models (LLMs) a esquecer informações específicas em seus conjuntos de dados sem exigir uma reconstrução completa dos dados de treinamento. Este método abre novas possibilidades para melhorar os LLMs e potencialmente resolver questões legais envolvendo conteúdo protegido por direitos autorais.

A equipe da Microsoft demonstrou recentemente como foi capaz de tornar o Llama-2 modelo esquece os detalhes dos livros de Harry Potter sem afetar outros dados nos dados de treinamento do modelo ou o desempenho geral do modelo em um estudo descrito na página do projeto de pesquisa.

O processo começa com a identificação de informações específicas no conjunto de dados do modelo que precisam ser esquecidas. Nesse caso, foram detalhes relacionados à série icônica de JK Rowling, incluindo detalhes da trama, nomes de personagens e citações famosas. Estas foram então sistematicamente substituídas por frases genéricas e não relacionadas.

Os pesquisadores então empregaram um modelo de linguagem para gerar novas informações com base nesses dados genéricos. Esses novos dados foram então usados ​​para treinar novamente o original Llama-2 modelo incrementalmente. A cada passo, a modelo se distanciava dos livros de Harry Potter até começar a produzir respostas alucinatórias quando questionada sobre eles.

Uma característica marcante desta abordagem é que ela não compromete o desempenho geral do modelo. Isto significa que, embora o LLM se torne cada vez mais esquecido em relação a dados específicos, as suas capacidades linguísticas globais permanecem intactas.

Apesar de esta abordagem ainda estar em fase de aperfeiçoamento, as suas implicações são amplas. Em situações que envolvem ações judiciais e questões de direitos autorais, em particular, pode fornecer uma tábua de salvação para aqueles que criam LLMs e outros modelos de IA.

Esta inovação surge num momento em que aumentam as disputas legais sobre a utilização de conteúdos protegidos por direitos de autor em modelos de IA. Por exemplo, O New York Times exigiu recentemente a remoção de suas publicações do GPT-4 conjunto de dados. No caso de um sucesso desafio legal, os desenvolvedores normalmente precisariam reconstruir seus conjuntos de dados de modelo, um processo demorado e que consome muitos recursos. O método da Microsoft, se for aperfeiçoado e adotado, poderá fornecer uma solução eficiente para tais desafios.

O método da Microsoft para esquecer seletivamente informações específicas em modelos de linguagem grande (LLMs) é um avanço significativo no desenvolvimento da IA, potencialmente abordando questões de conteúdo protegido por direitos autorais e simplificando o refinamento. Esta abordagem poderia ser aplicada a vários domínios, demonstrando o desenvolvimento e a aplicação responsáveis ​​da IA.

Aviso Legal

Em linha com a Diretrizes do Projeto Trust, observe que as informações fornecidas nesta página não se destinam e não devem ser interpretadas como aconselhamento jurídico, tributário, de investimento, financeiro ou qualquer outra forma. É importante investir apenas o que você pode perder e procurar aconselhamento financeiro independente se tiver alguma dúvida. Para mais informações, sugerimos consultar os termos e condições, bem como as páginas de ajuda e suporte fornecidas pelo emissor ou anunciante. MetaversePost está comprometida com relatórios precisos e imparciais, mas as condições de mercado estão sujeitas a alterações sem aviso prévio.

Sobre o autor

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Mais artigos
Damir Yalalov
Damir Yalalov

Damir é o líder de equipe, gerente de produto e editor da Metaverse Post, abordando tópicos como AI/ML, AGI, LLMs, Metaverse e Web3-Campos relacionados. Seus artigos atraem um grande público de mais de um milhão de usuários todos os meses. Ele parece ser um especialista com 10 anos de experiência em SEO e marketing digital. Damir foi mencionado em Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e outras publicações. Ele viaja entre os Emirados Árabes Unidos, Turquia, Rússia e CEI como um nômade digital. Damir formou-se em física, o que ele acredita ter lhe dado as habilidades de pensamento crítico necessárias para ter sucesso no cenário em constante mudança da internet. 

Hot Stories
Junte-se ao nosso boletim informativo.
Últimas notícias

Chega o dia da sentença: o destino de CZ está em equilíbrio enquanto o tribunal dos EUA considera o apelo do DOJ

Changpeng Zhao está prestes a ser condenado hoje em um tribunal dos EUA em Seattle.

Saber Mais

Fundadores da Samourai Wallet acusados ​​de facilitar US$ 2 bilhões em negócios Darknet

A apreensão dos fundadores da Samourai Wallet representa um revés notável para a indústria, ressaltando a persistência ...

Saber Mais
Junte-se à nossa comunidade tecnológica inovadora
Saiba Mais
Saiba mais
Abril de 2024 registra mínimo histórico em hacks e golpes, CertiK relata queda de 141% em relação a março
Mercados Segurança Wiki Histórias e resenhas Equipar
Abril de 2024 registra mínimo histórico em hacks e golpes, CertiK relata queda de 141% em relação a março
1 de maio de 2024
O preço do Bitcoin cai antes do anúncio da decisão da taxa de juros do Federal Reserve, analistas alertam sobre uma potencial mudança de mercado
Mercados Relatório de notícias Equipar
O preço do Bitcoin cai antes do anúncio da decisão da taxa de juros do Federal Reserve, analistas alertam sobre uma potencial mudança de mercado
1 de maio de 2024
PlayFi integra MultiversX para plug-and-play Web3 Experiência de Jogo
O negócio Relatório de notícias Equipar
PlayFi integra MultiversX para plug-and-play Web3 Experiência de Jogo
1 de maio de 2024
Galxe apresenta Passport V2 com ferramentas aprimoradas de privacidade e verificação para Web3
Relatório de notícias Equipar
Galxe apresenta Passport V2 com ferramentas aprimoradas de privacidade e verificação para Web3
30 de abril de 2024
CRYPTOMERIA LABS PTE. LTDA.