Notizie SMW Tecnologia
10 Maggio 2023

Anthropic propone una "IA contestuale" per modelli di chat basati su 60 principi

In Breve

OpenAI utilizza l'apprendimento per rinforzo dal feedback umano (RLHF) per l'allineamento modelli linguistici con principi umani, sicurezza e utilità.

Anthropic ha proposto un approccio alternativo: l'IA contestuale, che coinvolge le persone che scrivono una costituzione che il modello dovrebbe seguire.

Questa costituzione si basa sulla Dichiarazione dei diritti umani delle Nazioni Unite, sui Termini di servizio di Apple, sui principi che incoraggiano la considerazione delle prospettive non occidentali.

Anthropic ha proposto un nuovo approccio all'addestramento dei modelli di chat utilizzando 'IA costituzionale'. Questo metodo si basa su OpenAI'S insegnamento rafforzativo dal feedback umano ma si basa su di esso evitando la necessità di scrivere campioni di addestramento approfonditi. Invece, il modello è addestrato a rispondere all'input attraverso l'uso di una costituzione che dovrebbe agire come un insieme di leggi che il modello deve seguire.

Anthropic propone una "IA contestuale" per modelli di chat basati su 60 principi
antropic.com
Consigliato: Ex-OpenAI dipendenti hanno fondato Anthropic, un'azienda che ha attirato oltre 700 milioni di dollari di finanziamenti

Attraverso questo metodo, l'IA può generare i propri campioni di addestramento valutando ciò che ha detto rispetto al suo insieme di principi legalmente accettati. Questa tecnica che fa risparmiare tempo può essere vista come Isaac Asimov'S Leggi della robotica mettere in pratica.

I principi che stanno alla base del modello sono troppo numerosi per essere discussi in dettaglio. Tuttavia, coprono molti argomenti, come la moralità, l'avversione al rischio, l'economia e l'intelligenza artificiale. Ognuno è stato sviluppato per aiutare a guidare le decisioni dell'IA quando si tratta di rispondere spunti conversazionali.

Anthropic è riuscita ad addestrare efficacemente un modello di intelligenza artificiale chiamato Claude, con cui compete con successo OpenAI'S ChatGPT. Usando il Metodo Costituzione-AI, Claude potrebbe rispondere alle richieste conversazionali con un livello impressionante di precisione, ma sono previsti ulteriori miglioramenti man mano che Anthropic continua a basarsi su questa tecnologia rivoluzionaria.

Utilizzando la serie di principi e alcuni esempi di processo, al modello viene insegnato come valutare e rivedere le proprie risposte durante la prima fase. La seconda fase prevede l'addestramento di un modello utilizzando l'apprendimento per rinforzo, ma invece di utilizzare l'input degli esseri umani, utilizza il feedback generato dall'IA basato su una serie di principi per selezionare l'output più favorevole.

In effetti, questo nuovo approccio ha il potenziale per far risparmiare tempo e denaro alle aziende che non avranno più bisogno di costruire i propri campioni di formazione. Piuttosto, questo metodo "già pronto" può essere utilizzato come base per la creazione di modelli personalizzati, non è richiesta alcuna conoscenza di programmazione. È anche importante notare come questa tecnologia prometta anche di aumentare la sicurezza quando si tratta di robot conversazionali. Creazione di una serie di principi legalmente accettati attenua il rischio dell'intelligenza artificiale che diventa canaglia.

Pertanto, Constitution AI non solo promette di rendere lo sviluppo del modello di chat più facile e veloce, ma lo renderà anche più sicuro. Una situazione vantaggiosa sia per il mondo dell'Intelligenza Artificiale che per i ChatBot.

Uno sguardo analitico all'"IA contestuale" di Anthropic per i chatbot

L'IA contestuale di Anthropic si basa sull'incorporazione di oltre 60 principi derivati ​​dalla Dichiarazione dei diritti umani delle Nazioni Unite, dai Termini di servizio di Apple, dai Principi che incoraggiano la considerazione delle prospettive non occidentali, di Deepmind Regole del passero e Ricerca antropica Set 1 e Set 2.

Il fatto che ora si possa insegnare all’IA a comportarsi secondo principi derivati ​​da una gamma così ampia e diversificata di fonti è davvero notevole. Incorporando i principi della Dichiarazione dei diritti umani delle Nazioni Unite, ad esempio, le risposte dei chatbot ora riflettono l’importanza di preservare il concetto di libertà, uguaglianza e fratellanza. Tali principi sono una componente vitale per garantire ciò conversazioni chatbot rimanere etici e rispettosi. Allo stesso modo, l'incorporazione dei Termini di servizio di Apple garantisce la chatbot considera gli interessi di privacy dei propri utenti.

Anche i principi che incoraggiano la considerazione delle prospettive non occidentali svolgono un ruolo importante nel modello di "IA contestuale". Questi principi riflettono la necessità che l'IA rispetti le altre culture e garantisca che le risposte dei chatbot non siano percepite come dannose o offensive. Allo stesso modo, le Sparrow Rules di Deepmind impongono che il chatbot risponda con risposte intese a costruire una relazione con l'utente.

L'incorporazione di Anthropic Research Set 1 e Set 2 fornisce la garanzia finale che le conversazioni AI rimangano civili e rispettose. L'intelligenza artificiale è addestrata per garantire che risponda alle domande in modo premuroso e cortese.

Tutto sommato, il modello "Contextual AI" di Anthropic è una svolta incredibilmente importante nel campo della Ricerca sull'intelligenza artificiale. Consentendo che l'intelligenza artificiale venga insegnata secondo principi derivati ​​da una gamma così diversificata di fonti, le implicazioni etiche delle conversazioni automatizzate sono notevolmente migliorate.

Per saperne di più sull'intelligenza artificiale:

Negazione di responsabilità

In linea con la Linee guida del progetto Trust, si prega di notare che le informazioni fornite in questa pagina non intendono essere e non devono essere interpretate come consulenza legale, fiscale, di investimento, finanziaria o di qualsiasi altra forma. È importante investire solo ciò che puoi permetterti di perdere e chiedere una consulenza finanziaria indipendente in caso di dubbi. Per ulteriori informazioni, suggeriamo di fare riferimento ai termini e alle condizioni nonché alle pagine di aiuto e supporto fornite dall'emittente o dall'inserzionista. MetaversePost si impegna a fornire report accurati e imparziali, ma le condizioni di mercato sono soggette a modifiche senza preavviso.

Circa l'autore

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Altri articoli
Damir Jalalov
Damir Jalalov

Damir è il team leader, il product manager e l'editore di Metaverse Post, che copre argomenti come AI/ML, AGI, LLM, Metaverse e Web3campi correlati. I suoi articoli attirano un vasto pubblico di oltre un milione di utenti ogni mese. Sembra essere un esperto con 10 anni di esperienza in SEO e marketing digitale. Damir è stato menzionato in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto e altre pubblicazioni. Viaggia tra Emirati Arabi Uniti, Turchia, Russia e CSI come nomade digitale. Damir ha conseguito una laurea in fisica, che secondo lui gli ha fornito le capacità di pensiero critico necessarie per avere successo nel panorama in continua evoluzione di Internet. 

Cresce l’appetito istituzionale verso gli ETF Bitcoin in un contesto di volatilità

Le informazioni fornite tramite la documentazione 13F rivelano importanti investitori istituzionali che si dilettano negli ETF Bitcoin, sottolineando una crescente accettazione di...

Per saperne di più

Arriva il giorno della sentenza: il destino di CZ è in bilico mentre la Corte degli Stati Uniti considera l'appello del Dipartimento di Giustizia

Changpeng Zhao è pronto ad affrontare oggi la sentenza in un tribunale americano a Seattle.

Per saperne di più
Unisciti alla nostra comunità tecnologica innovativa
Scopri di più
Per saperne di più
Injective unisce le forze con AltLayer per portare la sicurezza del ripristino in inEVM
Affari Notizie Tecnologia
Injective unisce le forze con AltLayer per portare la sicurezza del ripristino in inEVM
3 Maggio 2024
Masa collabora con Teller per presentare il pool di prestiti MASA e consentire il prestito su base USDC
Mercati Notizie Tecnologia
Masa collabora con Teller per presentare il pool di prestiti MASA e consentire il prestito su base USDC
3 Maggio 2024
Velodrome lancia la versione beta di Superchain nelle prossime settimane e si espande su blockchain OP Stack Layer 2
Mercati Notizie Tecnologia
Velodrome lancia la versione beta di Superchain nelle prossime settimane e si espande su blockchain OP Stack Layer 2
3 Maggio 2024
CARV annuncia una partnership con Aethir per decentralizzare il proprio livello dati e distribuire premi
Affari Notizie Tecnologia
CARV annuncia una partnership con Aethir per decentralizzare il proprio livello dati e distribuire premi
3 Maggio 2024
LABORATORI DI CRITTOMERIA PTE. srl.