Ziņojums Tehnoloģija
Oktobris 10, 2023

Microsoft piespieda LLM aizmirst par Hariju Poteru

Microsoft piespieda LLM aizmirst par Hariju Poteru
Avots: Dall-E 3

Microsoft ir atklājusi metodi lai dotu norādījumus lielo valodu modeļiem (LLM) aizmirst konkrētu informāciju savās datu kopās, neprasot pilnīgu apmācības datu rekonstrukciju. Šī metode paver jaunas iespējas LLM uzlabošanai un, iespējams, juridisku problēmu risināšanai saistībā ar ar autortiesībām aizsargātu saturu.

Microsoft komanda nesen demonstrēja, kā viņi spēja izveidot Llama-2 modelis aizmirst informāciju par Harija Potera grāmatām, neietekmējot citus modeļa apmācības datus vai modeļa vispārējo veiktspēju pētījumā, kas aprakstīts viņu pētniecības projekta lapā.

Process sākas ar konkrētas informācijas identificēšanu modeļa datu kopā, kas ir jāaizmirst. Šajā gadījumā tā bija informācija par Dž.K. Roulingas ikonisko sēriju, tostarp sižeta specifika, varoņu vārdi un slaveni citāti. Pēc tam tās tika sistemātiski aizstātas ar vispārīgām, nesaistītām frāzēm.

Pēc tam pētnieki izmantoja valodas modeli, lai, pamatojoties uz šiem vispārīgajiem datiem, iegūtu jaunu informāciju. Pēc tam šie jaunie dati tika izmantoti, lai pārkvalificētu oriģinālu Llama-2 modelis pakāpeniski. Ar katru soli modele attālinājās no Harija Potera grāmatām, līdz sāka radīt halucinācijas atbildes, kad par tām jautāja.

Viena no šīs pieejas pārsteidzošajām iezīmēm ir tā, ka tā neietekmē modeļa vispārējo veiktspēju. Tas nozīmē, ka, lai gan LLM arvien vairāk aizmirst par konkrētiem datiem, tā vispārējās valodas iespējas paliek neskartas.

Neskatoties uz to, ka šī pieeja joprojām tiek pilnveidota, tās sekas ir plašas. Situācijās, kas saistītas ar juridiskām prasībām un autortiesību jautājumiem, tas var būt glābšanas riņķis tiem, kas veido LLM un citus AI modeļus.

Šis jauninājums nāk laikā, kad pieaug juridiski strīdi par ar autortiesībām aizsargāta satura izmantošanu AI modeļos. Piemēram, The New York Times nesen pieprasīja noņemt tās publikācijas no GPT-4 datu kopa. Veiksmes gadījumā juridiskais izaicinājums, izstrādātājiem parasti būtu jārekonstruē modeļu datu kopas, kas ir laikietilpīgs un resursietilpīgs process. Microsoft metode, ja tā tiks pilnveidota un pieņemta, varētu nodrošināt efektīvu risinājumu šādām problēmām.

Microsoft metode, lai selektīvi aizmirstu konkrētu informāciju lielos valodu modeļos (LLM) ir nozīmīgs sasniegums AI attīstībā, kas, iespējams, risina ar autortiesībām aizsargāta satura problēmas un racionalizē pilnveidošanu. Šo pieeju varētu izmantot dažādās jomās, demonstrējot atbildīgu AI izstrādi un pielietojumu.

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Vairāk rakstus
Damirs Jalalovs
Damirs Jalalovs

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

Nepastāvības apstākļos institucionālā apetīte pieaug pret Bitcoin ETF

Informācijas atklāšana, izmantojot 13F pieteikumus, atklāj ievērojamus institucionālos investorus, kas iesaistās Bitcoin ETF, uzsverot pieaugošo pieņemšanu ...

Uzziniet vairāk

Pienāk notiesāšanas diena: CZ liktenis ir līdzsvarā, jo ASV tiesa izskata DOJ lūgumu

Šodien ASV tiesā Sietlā Čanpens Džao ir gatavs notiesāt.

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
Espresso Systems sadarbojas ar Polygon Labs, lai izstrādātu AggLayer, lai uzlabotu apkopojuma savietojamību
bizness Ziņojums Tehnoloģija
Espresso Systems sadarbojas ar Polygon Labs, lai izstrādātu AggLayer, lai uzlabotu apkopojuma savietojamību
9. gada 2024. maijs
ZKP darbināms infrastruktūras protokols ZKBase iepazīstina ar ceļvedi, plāno Testnet palaišanu maijā
Ziņojums Tehnoloģija
ZKP darbināms infrastruktūras protokols ZKBase iepazīstina ar ceļvedi, plāno Testnet palaišanu maijā
9. gada 2024. maijs
BLOCKCHANCE un CONF3RENCE Apvienojieties Vācijas lielākās vienības labā Web3 Konference Dortmundē
bizness Markets programmatūra Stāsti un atsauksmes Tehnoloģija
BLOCKCHANCE un CONF3RENCE Apvienojieties Vācijas lielākās vienības labā Web3 Konference Dortmundē
9. gada 2024. maijs
NuLink tiek palaists vietnē Bybit Web3 IDO platforma. Abonēšanas posms pagarinās līdz 13. maijam
Markets Ziņojums Tehnoloģija
NuLink tiek palaists vietnē Bybit Web3 IDO platforma. Abonēšanas posms pagarinās līdz 13. maijam
9. gada 2024. maijs
CRYPTOMERIA LABS PTE. LTD.