Nyheds rapport Teknologier
Oktober 10, 2023

Microsoft tvang LLM'er til at glemme Harry Potter

Microsoft tvang LLM'er til at glemme Harry Potter
Kilde: Dall-E 3

Microsoft har afsløret en metode for at instruere store sprogmodeller (LLM'er) til at glemme specifik information i deres datasæt uden at kræve en fuldstændig rekonstruktion af træningsdataene. Denne metode åbner op for nye muligheder for at forbedre LLM'er og potentielt løse juridiske problemer, der involverer ophavsretligt beskyttet indhold.

Microsofts team demonstrerede for nylig, hvordan de var i stand til at lave Llama-2-modellen glemmer detaljerne i Harry Potter-bøgerne uden at påvirke andre data i modellens træningsdata eller modellens overordnede præstation i en undersøgelse beskrevet på deres forskningsprojektside.

Processen begynder med identifikation af specifikke oplysninger inden for modellens datasæt, som skal glemmes. I dette tilfælde var det detaljer relateret til JK Rowlings ikoniske serie, inklusive plotspecifikationer, karakternavne og berømte citater. Disse blev derefter systematisk erstattet med generiske, ikke-relaterede sætninger.

Forskerne brugte derefter en sprogmodel til at generere ny information baseret på disse generiske data. Disse friske data blev derefter brugt til at genoptræne originalen Llama-2 model trinvist. Med hvert trin tog modellen afstand fra Harry Potter-bøgerne, indtil den begyndte at producere hallucinatoriske svar, når de blev spurgt om dem.

Et slående træk ved denne tilgang er, at den ikke kompromitterer modellens generelle ydeevne. Dette betyder, at mens LLM bliver mere og mere glemsom med hensyn til specifikke data, forbliver dens overordnede sprogfunktioner intakte.

På trods af at denne tilgang stadig er ved at blive forfinet, er dens implikationer vidtrækkende. I situationer, der især involverer juridiske krav og ophavsretlige spørgsmål, kan det være en livline til dem, der skaber LLM'er og andre AI-modeller.

Denne innovation kommer på et tidspunkt, hvor juridiske tvister om brugen af ​​ophavsretligt beskyttet indhold i AI-modeller er stigende. For eksempel, New York Times krævede for nylig fjernelse af sine publikationer fra GPT-4 datasæt. I tilfælde af en vellykket Juridisk udfordring, vil udviklere typisk skulle rekonstruere deres modeldatasæt, en tidskrævende og ressourcekrævende proces. Microsofts metode kan, hvis den bliver yderligere forfinet og vedtaget, give en effektiv løsning på sådanne udfordringer.

Microsofts metode til selektivt at glemme specifik information inden for store sprogmodeller (LLM'er) er et væsentligt gennembrud inden for AI-udvikling, der potentielt løser problemer med ophavsretligt beskyttet indhold og strømliner raffinement. Denne tilgang kan anvendes på forskellige domæner, hvilket viser ansvarlig AI-udvikling og anvendelse.

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

From Ripple to The Big Green DAO: How Cryptocurrency Projects Contribute to Charity

Lad os undersøge initiativer, der udnytter potentialet i digitale valutaer til velgørende formål.

Vide mere

AlphaFold 3, Med-Gemini og andre: The Way AI Transforms Healthcare in 2024

AI manifesterer sig på forskellige måder i sundhedsvæsenet, fra at afsløre nye genetiske sammenhænge til at styrke robotkirurgiske systemer ...

Vide mere
Læs mere
Læs mere
Gate.io adresserer rygter i officiel AMA: 'Reserver overstiger $10B, sikrer fjerde globale rang'
Forretning Nyheds rapport Teknologier
Gate.io adresserer rygter i officiel AMA: 'Reserver overstiger $10B, sikrer fjerde globale rang'
13. December, 2024
Kina tager føringen inden for farmaceutisk dataanalyse, efterhånden som det globale marked udvides
Udtalelse Forretning Markeder Software Teknologier
Kina tager føringen inden for farmaceutisk dataanalyse, efterhånden som det globale marked udvides
13. December, 2024
Fra Circle og Binance til Avelacom og CryptoStruct: Denne uges bedste kryptopartnerskaber
Fordøje Forretning Markeder Software Teknologier
Fra Circle og Binance til Avelacom og CryptoStruct: Denne uges bedste kryptopartnerskaber
13. December, 2024
Astar Network lancerer 'Astar Surge', der gør det muligt for brugere at låse ASTR og optjene belønninger
Nyheds rapport Teknologier
Astar Network lancerer 'Astar Surge', der gør det muligt for brugere at låse ASTR og optjene belønninger
13. December, 2024