Nyheds rapport Teknologier
Oktober 10, 2023

Microsoft tvang LLM'er til at glemme Harry Potter

Microsoft tvang LLM'er til at glemme Harry Potter
Kilde: Dall-E 3

Microsoft har afsløret en metode for at instruere store sprogmodeller (LLM'er) til at glemme specifik information i deres datasæt uden at kræve en fuldstændig rekonstruktion af træningsdataene. Denne metode åbner op for nye muligheder for at forbedre LLM'er og potentielt løse juridiske problemer, der involverer ophavsretligt beskyttet indhold.

Microsofts team demonstrerede for nylig, hvordan de var i stand til at lave Llama-2-modellen glemmer detaljerne i Harry Potter-bøgerne uden at påvirke andre data i modellens træningsdata eller modellens overordnede præstation i en undersøgelse beskrevet på deres forskningsprojektside.

Processen begynder med identifikation af specifikke oplysninger inden for modellens datasæt, som skal glemmes. I dette tilfælde var det detaljer relateret til JK Rowlings ikoniske serie, inklusive plotspecifikationer, karakternavne og berømte citater. Disse blev derefter systematisk erstattet med generiske, ikke-relaterede sætninger.

Forskerne brugte derefter en sprogmodel til at generere ny information baseret på disse generiske data. Disse friske data blev derefter brugt til at genoptræne originalen Llama-2 model trinvist. Med hvert trin tog modellen afstand fra Harry Potter-bøgerne, indtil den begyndte at producere hallucinatoriske svar, når de blev spurgt om dem.

Et slående træk ved denne tilgang er, at den ikke kompromitterer modellens generelle ydeevne. Dette betyder, at mens LLM bliver mere og mere glemsom med hensyn til specifikke data, forbliver dens overordnede sprogfunktioner intakte.

På trods af at denne tilgang stadig er ved at blive forfinet, er dens implikationer vidtrækkende. I situationer, der især involverer juridiske krav og ophavsretlige spørgsmål, kan det være en livline til dem, der skaber LLM'er og andre AI-modeller.

Denne innovation kommer på et tidspunkt, hvor juridiske tvister om brugen af ​​ophavsretligt beskyttet indhold i AI-modeller er stigende. For eksempel, New York Times krævede for nylig fjernelse af sine publikationer fra GPT-4 datasæt. I tilfælde af en vellykket Juridisk udfordring, vil udviklere typisk skulle rekonstruere deres modeldatasæt, en tidskrævende og ressourcekrævende proces. Microsofts metode kan, hvis den bliver yderligere forfinet og vedtaget, give en effektiv løsning på sådanne udfordringer.

Microsofts metode til selektivt at glemme specifik information inden for store sprogmodeller (LLM'er) er et væsentligt gennembrud inden for AI-udvikling, der potentielt løser problemer med ophavsretligt beskyttet indhold og strømliner raffinement. Denne tilgang kan anvendes på forskellige domæner, hvilket viser ansvarlig AI-udvikling og anvendelse.

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Espresso Systems samarbejder med Polygon Labs for at udvikle AggLayer for at forbedre sammenlægningens interoperabilitet
Forretning Nyheds rapport Teknologier
Espresso Systems samarbejder med Polygon Labs for at udvikle AggLayer for at forbedre sammenlægningens interoperabilitet
Maj 9, 2024
ZKP-drevet infrastrukturprotokol ZKBase afslører køreplan, planlægger testnet-lancering i maj
Nyheds rapport Teknologier
ZKP-drevet infrastrukturprotokol ZKBase afslører køreplan, planlægger testnet-lancering i maj
Maj 9, 2024
BLOCKCHANCE og CONF3RENCE forenes for Tysklands største Web3 Konference i Dortmund
Forretning Markeder Software Historier og anmeldelser Teknologier
BLOCKCHANCE og CONF3RENCE forenes for Tysklands største Web3 Konference i Dortmund
Maj 9, 2024
NuLink lancerer på Bybit Web3 IDO platform. Abonnementsfasen forlænges til 13. maj
Markeder Nyheds rapport Teknologier
NuLink lancerer på Bybit Web3 IDO platform. Abonnementsfasen forlænges til 13. maj
Maj 9, 2024