Notizie Tecnologia
Ottobre 10, 2023

Microsoft ha costretto gli LLM a dimenticare Harry Potter

Microsoft ha costretto gli LLM a dimenticare Harry Potter
Fonte: Dall-E 3

Microsoft ha rivelato un metodo per istruire i Large Language Models (LLM) a dimenticare informazioni specifiche all'interno dei loro set di dati senza richiedere una ricostruzione completa dei dati di addestramento. Questo metodo apre nuove possibilità per migliorare i LLM e potenzialmente risolvere problemi legali che coinvolgono contenuti protetti da copyright.

Il team di Microsoft ha recentemente dimostrato come è riuscito a realizzare il Llama-2 il modello dimentica i dettagli dei libri di Harry Potter senza influenzare altri dati nei dati di addestramento del modello o le prestazioni complessive del modello in uno studio descritto nella pagina del progetto di ricerca.

Il processo inizia con l'identificazione di informazioni specifiche all'interno del set di dati del modello che devono essere dimenticate. In questo caso, si trattava di dettagli relativi all'iconica serie di JK Rowling, inclusi dettagli specifici della trama, nomi dei personaggi e citazioni famose. Queste sono state poi sistematicamente sostituite con frasi generiche e non correlate.

I ricercatori hanno poi utilizzato un modello linguistico per generare nuove informazioni basate su questi dati generici. Questi nuovi dati sono stati quindi utilizzati per riqualificare l'originale Llama-2 modello in modo incrementale. Ad ogni passo, il modello prendeva le distanze dai libri di Harry Potter finché non iniziava a produrre risposte allucinatorie quando veniva interrogato su di essi.

Una caratteristica sorprendente di questo approccio è che non compromette le prestazioni generali del modello. Ciò significa che mentre il LLM diventa sempre più dimentico di dati specifici, le sue capacità linguistiche complessive rimangono intatte.

Nonostante questo approccio sia ancora in fase di perfezionamento, le sue implicazioni sono di ampia portata. In situazioni che coinvolgono rivendicazioni legali e questioni di copyright, in particolare, può fornire un’ancora di salvezza a coloro che creano LLM e altri modelli di intelligenza artificiale.

Questa innovazione arriva in un momento in cui sono in aumento le controversie legali sull’uso di contenuti protetti da copyright nei modelli di intelligenza artificiale. Ad esempio, Il New York Times ne ha recentemente chiesto la rimozione delle sue pubblicazioni dal GPT-4 set di dati. In caso di successo sfida legale, gli sviluppatori dovrebbero in genere ricostruire i set di dati del modello, un processo dispendioso in termini di tempo e risorse. Il metodo di Microsoft, se ulteriormente perfezionato e adottato, potrebbe fornire una soluzione efficiente a tali sfide.

Il metodo di Microsoft per dimenticare selettivamente informazioni specifiche all'interno dei modelli linguistici di grandi dimensioni (LLM) rappresenta un passo avanti significativo nello sviluppo dell'intelligenza artificiale, poiché risolve potenzialmente i problemi relativi ai contenuti protetti da copyright e ne semplifica il perfezionamento. Questo approccio potrebbe essere applicato a vari ambiti, dimostrando lo sviluppo e l’applicazione responsabile dell’IA.

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Cresce l’appetito istituzionale verso gli ETF Bitcoin in un contesto di volatilità

Le informazioni fornite tramite la documentazione 13F rivelano importanti investitori istituzionali che si dilettano negli ETF Bitcoin, sottolineando una crescente accettazione di...

Per saperne di più

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Espresso Systems collabora con Polygon Labs per sviluppare AggLayer per migliorare l'interoperabilità dei rollup
Affari Notizie Tecnologia
Espresso Systems collabora con Polygon Labs per sviluppare AggLayer per migliorare l'interoperabilità dei rollup
9 Maggio 2024
Protocollo infrastrutturale basato su ZKP ZKBase svela la roadmap e pianifica il lancio di Testnet a maggio
Notizie Tecnologia
Protocollo infrastrutturale basato su ZKP ZKBase svela la roadmap e pianifica il lancio di Testnet a maggio
9 Maggio 2024
BLOCKCHANCE e CONF3RENCE si uniscono per il più grande della Germania Web3 Conferenza a Dortmund
Affari Mercati Software Storie e recensioni Tecnologia
BLOCKCHANCE e CONF3RENCE si uniscono per il più grande della Germania Web3 Conferenza a Dortmund
9 Maggio 2024
NuLink viene lanciato su Bybit Web3 Piattaforma IDO. La fase di abbonamento si estende fino al 13 maggio
Mercati Notizie Tecnologia
NuLink viene lanciato su Bybit Web3 Piattaforma IDO. La fase di abbonamento si estende fino al 13 maggio
9 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.