Tudósítást Technológia
Október 10, 2023

A Microsoft arra kényszerítette az LLM-eket, hogy felejtsék el Harry Pottert

A Microsoft arra kényszerítette az LLM-eket, hogy felejtsék el Harry Pottert
Forrás: Dall-E 3

A Microsoft feltárt egy módszert a Large Language Models (LLM) utasítására, hogy felejtsenek el bizonyos információkat az adatkészleteikben anélkül, hogy szükség lenne a betanítási adatok teljes rekonstrukciójára. Ez a módszer új lehetőségeket nyit meg az LLM-ek fejlesztésében és a szerzői jog által védett tartalommal kapcsolatos jogi problémák esetleges megoldásában.

A Microsoft csapata nemrégiben bemutatta, hogyan tudták elkészíteni a Llama-2 modell elfelejti a Harry Potter könyvek részleteit anélkül, hogy befolyásolná a modell képzési adataiban szereplő egyéb adatokat vagy a modell általános teljesítményét a kutatási projekt oldalán leírt tanulmányban.

A folyamat a modell adatkészletén belüli konkrét információk azonosításával kezdődik, amelyeket el kell felejteni. Ebben az esetben JK Rowling ikonikus sorozatához kapcsolódó részletekről volt szó, beleértve a cselekmény sajátosságait, a karakterneveket és a híres idézeteket. Ezeket azután szisztematikusan általános, nem kapcsolódó kifejezésekkel helyettesítették.

A kutatók ezután egy nyelvi modellt alkalmaztak, hogy ezen általános adatok alapján új információkat generáljanak. Ezt a friss adatot használták fel az eredeti újraképzésére Llama-2 modell fokozatosan. A modell minden lépéssel elhatárolódott a Harry Potter-könyvektől, amíg hallucinációs válaszokat nem kezdett produkálni, amikor megkérdezték róluk.

Ennek a megközelítésnek az egyik feltűnő jellemzője, hogy nem veszélyezteti a modell általános teljesítményét. Ez azt jelenti, hogy miközben az LLM egyre inkább megfeledkezik bizonyos adatokról, általános nyelvi képességei érintetlenek maradnak.

Annak ellenére, hogy ez a megközelítés még mindig finomítás alatt áll, következményei széleskörűek. Különösen jogi követelésekkel és szerzői jogi problémákkal kapcsolatos helyzetekben jelenthet mentőövet az LLM-eket és más mesterséges intelligencia modelleket létrehozók számára.

Ez az innováció abban az időben jött létre, amikor egyre szaporodnak a jogi viták a szerzői jog által védett tartalmak mesterséges intelligencia modellekben való felhasználásával kapcsolatban. Például, A New York Times nemrégiben követelte az eltávolítást kiadványai közül a GPT-4 adatkészlet. Siker esetén jogi kihívás, a fejlesztőknek általában rekonstruálniuk kell modelladatkészleteiket, ami idő- és erőforrás-igényes folyamat. A Microsoft módszere, ha tovább finomítják és elfogadják, hatékony megoldást nyújthat az ilyen kihívásokra.

A Microsoft módszere bizonyos információk szelektív elfelejtésére a nagy nyelvi modellekben (LLM-ek) jelentős áttörést jelent a mesterséges intelligencia fejlesztésében, amely potenciálisan megoldja a szerzői jog által védett tartalommal kapcsolatos problémákat és egyszerűsíti a finomítást. Ez a megközelítés különféle területeken alkalmazható, demonstrálva a felelős AI fejlesztést és alkalmazást.

A felelősség megtagadása

Összhangban a A Trust Project irányelvei, kérjük, vegye figyelembe, hogy az ezen az oldalon közölt információk nem minősülnek jogi, adózási, befektetési, pénzügyi vagy bármilyen más formájú tanácsnak, és nem is értelmezhetők. Fontos, hogy csak annyit fektessen be, amennyit megengedhet magának, hogy elveszítsen, és kérjen független pénzügyi tanácsot, ha kétségei vannak. További információkért javasoljuk, hogy tekintse meg a szerződési feltételeket, valamint a kibocsátó vagy hirdető által biztosított súgó- és támogatási oldalakat. MetaversePost elkötelezett a pontos, elfogulatlan jelentéstétel mellett, de a piaci feltételek előzetes értesítés nélkül változhatnak.

A szerzőről

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

További cikkek
Damir Jalalov
Damir Jalalov

Damir a csapat vezetője, termékmenedzsere és szerkesztője Metaverse Post, olyan témákkal foglalkozik, mint az AI/ML, AGI, LLMs, Metaverse és Web3- kapcsolódó mezők. Cikkei havonta több mint egymillió felhasználót vonzanak. Úgy tűnik, szakértő, aki 10 éves tapasztalattal rendelkezik a SEO és a digitális marketing területén. Damirt a Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto és más kiadványok. Digitális nomádként utazik az Egyesült Arab Emírségek, Törökország, Oroszország és a FÁK között. Damir fizikából szerzett bachelor-diplomát, és úgy gondolja, hogy ez megadta neki azokat a kritikus gondolkodási készségeket, amelyek szükségesek ahhoz, hogy sikeres legyen az internet folyamatosan változó táján. 

Hot Stories

Új kriptovaluták Redefine Blockchain Innovation 2025-ben

by Victoria d'Este
December 03, 2024
Csatlakozzon hírlevelünkhöz.
Legfrissebb hírek

A Ripple-től a The Big Green DAO-ig: Hogyan járulnak hozzá a kriptovaluta projektek a jótékonysághoz

Fedezze fel a digitális valutákban rejlő lehetőségeket jótékony célokra hasznosító kezdeményezéseket.

Tudjon meg többet

AlphaFold 3, Med-Gemini és mások: The Way AI Transforms Healthcare 2024

A mesterséges intelligencia különféle módokon nyilvánul meg az egészségügyben, az új genetikai összefüggések feltárásától a robotsebészeti rendszerek felhatalmazásáig...

Tudjon meg többet
Olvasson többet
Tovább
A bitcoin ára 88,000 XNUMX dollár alá esik a dél-koreai kriptotőzsdéken, mivel az ország hadiállapotot hirdetett
üzleti piacok Tudósítást Technológia
A bitcoin ára 88,000 XNUMX dollár alá esik a dél-koreai kriptotőzsdéken, mivel az ország hadiállapotot hirdetett
December 3, 2024
Új kriptovaluták Redefine Blockchain Innovation 2025-ben
Vélemény üzleti piacok Technológia
Új kriptovaluták Redefine Blockchain Innovation 2025-ben
December 3, 2024
A Chromia befejezi az Asgard Mainnet frissítését, és elindítja az Oracle bővítményt
Tudósítást Technológia
A Chromia befejezi az Asgard Mainnet frissítését, és elindítja az Oracle bővítményt
December 3, 2024
Az Orbitt Staking közel 2 millió dolláros ORBT-jutalommal indul
Tudósítást Technológia
Az Orbitt Staking közel 2 millió dolláros ORBT-jutalommal indul
December 3, 2024
CRYPTOMERIA LABS PTE. KFT.