Novinová správa Technológia
Októbra 10, 2023

Microsoft prinútil LLM zabudnúť na Harryho Pottera

Microsoft prinútil LLM zabudnúť na Harryho Pottera
Zdroj: Dall-E 3

Microsoft odhalil metódu za pokyny pre veľké jazykové modely (LLM), aby zabudli špecifické informácie vo svojich súboroch údajov bez toho, aby vyžadovali úplnú rekonštrukciu trénovacích údajov. Táto metóda otvára nové možnosti na zlepšenie LLM a potenciálne riešenie právnych problémov s obsahom chráneným autorskými právami.

Tím Microsoftu nedávno ukázal, ako sa im to podarilo Llama-2 model zabudne na detaily kníh o Harrym Potterovi bez toho, aby to ovplyvnilo iné údaje v tréningových údajoch modelu alebo celkový výkon modelu v štúdii opísanej na stránke ich výskumného projektu.

Proces začína identifikáciou špecifických informácií v rámci súboru údajov modelu, na ktoré je potrebné zabudnúť. V tomto prípade išlo o detaily súvisiace s ikonickou sériou JK Rowlingovej vrátane špecifík deja, mien postáv a slávnych citátov. Tie boli potom systematicky nahradené všeobecnými, nesúvisiacimi frázami.

Výskumníci potom použili jazykový model na generovanie nových informácií na základe týchto všeobecných údajov. Tieto čerstvé údaje sa potom použili na preškolenie originálu Llama-2 model postupne. Každým krokom sa modelka dištancovala od kníh o Harrym Potterovi, až kým nezačala produkovať halucinačné reakcie, keď sa na ne pýtali.

Jednou z výrazných vlastností tohto prístupu je, že neohrozuje všeobecný výkon modelu. To znamená, že zatiaľ čo LLM čoraz viac zabúda na konkrétne údaje, jeho celkové jazykové schopnosti zostávajú nedotknuté.

Napriek tomu, že sa tento prístup stále zdokonaľuje, jeho dôsledky sú široké. Najmä v situáciách týkajúcich sa právnych nárokov a autorských práv môže poskytnúť záchranné lano tým, ktorí vytvárajú LLM a iné modely AI.

Táto inovácia prichádza v čase, keď pribúdajú právne spory o používaní obsahu chráneného autorskými právami v modeloch AI. napr. New York Times nedávno požadoval odstránenie svojich publikácií z GPT-4 súbor údajov. V prípade úspešného právna výzva, vývojári zvyčajne potrebujú rekonštruovať svoje modelové množiny údajov, čo je časovo a zdrojovo náročný proces. Metóda spoločnosti Microsoft, ak bude ďalej vylepšená a prijatá, by mohla poskytnúť efektívne riešenie takýchto problémov.

Metóda spoločnosti Microsoft na selektívne zabudnutie konkrétnych informácií v rámci veľkých jazykových modelov (LLM) predstavuje významný prelom vo vývoji AI, ktorý potenciálne rieši problémy s obsahom chráneným autorskými právami a zefektívňuje zdokonaľovanie. Tento prístup by sa dal použiť v rôznych doménach, čo demonštruje zodpovedný vývoj a aplikáciu AI.

Vylúčenie zodpovednosti

V súlade s Pokyny k projektu Trust, uvedomte si, že informácie uvedené na tejto stránke nie sú zamýšľané a nemali by byť interpretované ako právne, daňové, investičné, finančné alebo iné formy poradenstva. Je dôležité investovať len toľko, koľko si môžete dovoliť stratiť a v prípade akýchkoľvek pochybností vyhľadať nezávislé finančné poradenstvo. Ak chcete získať ďalšie informácie, odporúčame vám pozrieť si zmluvné podmienky, ako aj stránky pomoci a podpory poskytnuté vydavateľom alebo inzerentom. MetaversePost sa zaviazala poskytovať presné a nezaujaté správy, ale podmienky na trhu sa môžu zmeniť bez upozornenia.

O autorovi

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Ďalšie články
Damir Yalalov
Damir Yalalov

Damir je vedúci tímu, produktový manažér a redaktor v Metaverse Post, pokrývajúce témy ako AI/ML, AGI, LLM, Metaverse a Web3- súvisiace oblasti. Jeho články priťahujú každý mesiac obrovské publikum s viac ako miliónom používateľov. Zdá sa, že je odborníkom s 10-ročnými skúsenosťami v oblasti SEO a digitálneho marketingu. Damir bol spomenutý v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a ďalšie publikácie. Ako digitálny nomád cestuje medzi SAE, Tureckom, Ruskom a SNŠ. Damir získal bakalársky titul z fyziky, o ktorom sa domnieva, že mu dal schopnosti kritického myslenia potrebné na to, aby bol úspešný v neustále sa meniacom prostredí internetu. 

Hot Stories
Pridajte sa k nášmu newsletteru.
Novinky

Inštitucionálny apetít rastie smerom k bitcoinovým ETF uprostred volatility

Zverejnenia prostredníctvom podaní 13F odhaľujú pozoruhodných inštitucionálnych investorov, ktorí sa venujú bitcoinovým ETF, čo podčiarkuje rastúcu akceptáciu ...

vedieť viac

Prichádza deň odsúdenia: Osud CZ visí v rovnováhe, pretože americký súd zvažuje žalobu ministerstva spravodlivosti

Changpeng Zhao dnes čaká na americkom súde v Seattli odsúdenie.

vedieť viac
Pripojte sa k našej komunite inovatívnych technológií
Čítaj viac
Čítaj viac
Espresso Systems spolupracuje s polygonovými laboratóriami na vývoji AggLayer pre zlepšenie súhrnnej interoperability
firmy Novinová správa Technológia
Espresso Systems spolupracuje s polygonovými laboratóriami na vývoji AggLayer pre zlepšenie súhrnnej interoperability
Môže 9, 2024
Infraštruktúrny protokol založený na ZKP ZKBase odhaľuje cestovnú mapu, plánuje spustenie Testnetu v máji
Novinová správa Technológia
Infraštruktúrny protokol založený na ZKP ZKBase odhaľuje cestovnú mapu, plánuje spustenie Testnetu v máji
Môže 9, 2024
BLOCKCHANCE a CONF3RENCE Spojte sa pre najväčšieho v Nemecku Web3 Konferencia v Dortmunde
firmy trhy Softvér Príbehy a recenzie Technológia
BLOCKCHANCE a CONF3RENCE Spojte sa pre najväčšieho v Nemecku Web3 Konferencia v Dortmunde
Môže 9, 2024
NuLink sa spúšťa na Bybit Web3 Platforma IDO. Fáza predplatného trvá do 13. mája
trhy Novinová správa Technológia
NuLink sa spúšťa na Bybit Web3 Platforma IDO. Fáza predplatného trvá do 13. mája
Môže 9, 2024
CRYPTOMERIA LABS PTE. LTD.