Ziņojums SMW Tehnoloģija
10. gada 2023. maijs

Anthropic ierosina "kontekstuālo AI" tērzēšanas modeļiem, pamatojoties uz 60 principiem

Īsumā

OpenAI izmanto pastiprināšanas mācīšanos no cilvēka atgriezeniskās saites (RLHF), lai izlīdzinātu valodu modeļi ar cilvēciskajiem principiem, drošību un lietderību.

Anthropic ierosināja alternatīvu pieeju: kontekstuālo AI, kurā cilvēki raksta konstitūciju, kas modelim būtu jāievēro.

Šī konstitūcija ir balstīta uz Apvienoto Nāciju Organizācijas Cilvēktiesību deklarāciju, Apple pakalpojumu noteikumiem, principiem, kas mudina ņemt vērā ne-Rietumu perspektīvas.

Anthropic ir ierosinājis jaunu pieeju tērzēšanas modeļu apmācībai, izmantojotKonstitucionālais AI'. Šī metode balstās uz OpenAI'S pastiprināt mācīšanās no cilvēku atsauksmēm, bet balstās uz to, izvairoties no nepieciešamības rakstīt dziļus apmācības paraugus. Tā vietā modelis ir apmācīts reaģēt uz ievadi, izmantojot konstitūciju, kas ir paredzēta kā likumu kopums, kas modelim jāievēro.

Anthropic ierosina "kontekstuālo AI" tērzēšanas modeļiem, pamatojoties uz 60 principiem
anthropic.com
Ieteicams: Ex-OpenAI darbinieki nodibināja Anthropic, uzņēmumu, kas ir piesaistījis vairāk nekā 700 miljonus USD finansējumu

Izmantojot šo metodi, mākslīgais intelekts var ģenerēt savus apmācības paraugus, izvērtējot teikto salīdzinājumā ar juridiski pieņemto principu kopumu. Šo laiku taupošo paņēmienu var uzskatīt par Isaac Asimovs Robotikas likumi īstenot praksē.

Principu, kas veido modeļa pamatu, ir pārāk daudz, lai tos detalizēti apspriestu. Tomēr tie aptver daudzas tēmas, piemēram, morāli, izvairīšanos no riska, ekonomiku un mākslīgo intelektu. Katrs no tiem ir izstrādāts, lai palīdzētu vadīt AI lēmumus, reaģējot uz tiem sarunvalodas uzvednes.

Anthropic ir izdevies efektīvi apmācīt AI modeli ar nosaukumu Klods, kurš veiksmīgi konkurē ar OpenAI'S ChatGPT. Izmantojot Konstitūcijas-AI metode, Klods varētu reaģēt uz sarunvalodas uzvednēm ar iespaidīgu precizitātes līmeni, taču ir sagaidāmi papildu uzlabojumi, jo Anthropic turpina pilnveidot šo spēli mainošo tehnoloģiju.

Izmantojot principu kopumu un dažus procesa piemērus, modelis tiek mācīts, kā novērtēt un pārskatīt savas atbildes pirmajā posmā. Otrajā posmā tiek apmācīts modelis, izmantojot pastiprinošu mācīšanos, bet tā vietā, lai izmantotu cilvēku sniegto informāciju, tā izmanto AI ģenerētu atgriezenisko saiti, pamatojoties uz principu kopumu, lai atlasītu labvēlīgāku rezultātu.

Patiešām, šī jaunā pieeja var ietaupīt laiku un naudu uzņēmumiem, kuriem vairs nebūs jāveido savi apmācību paraugi. Drīzāk šo “gatavu” metodi var izmantot kā pamatu pielāgotu modeļu izveidei — nav nepieciešamas programmēšanas zināšanas. Ir arī svarīgi atzīmēt, kā šī tehnoloģija arī sola palielināt drošību, kad runa ir par sarunu robotiem. Juridiski pieņemtu principu kopuma izveide samazina risku AI kļūst negodīgi.

Tāpēc Constituation AI sola ne tikai padarīt tērzēšanas modeļa izstrādi vieglāku un ātrāku, bet arī padarīs to drošāku. Abpusēji izdevīga situācija gan mākslīgā intelekta, gan tērzēšanas robotu pasaulei.

Analītisks skatījums uz Anthropic “kontekstuālo AI” tērzēšanas robotiem

Anthropic kontekstuālā AI pamatā ir vairāk nekā 60 principu, kas izriet no Apvienoto Nāciju Organizācijas Cilvēktiesību deklarācijas, Apple pakalpojumu sniegšanas noteikumiem, principiem, kas mudina ņemt vērā ne-Rietumu perspektīvas, iekļaušanu, Deepmind's Zvirbuļu noteikumi un antropiskās izpētes 1. un 2. komplekts.

Fakts, ka AI tagad var iemācīt rīkoties saskaņā ar principiem, kas izriet no tik plaša un daudzveidīga avotu klāsta, ir patiesi ievērojams. Iekļaujot, piemēram, Apvienoto Nāciju Organizācijas Cilvēktiesību deklarācijas principus, tērzēšanas robotu atbildes tagad atspoguļo brīvības, vienlīdzības un brālības jēdziena saglabāšanas nozīmi. Šādi principi ir būtiska sastāvdaļa, lai to nodrošinātu chatbot sarunas palikt ētiski un cieņpilni. Tāpat Apple pakalpojumu sniegšanas noteikumu iekļaušana nodrošina chatbot ņem vērā savu lietotāju privātuma intereses.

Principi, kas mudina ņemt vērā ne-Rietumu perspektīvas, arī spēlē nozīmīgu lomu “Kontekstuālā AI” modelī. Šie principi atspoguļo nepieciešamību AI cienīt citas kultūras un nodrošināt, ka tērzēšanas robotu atbildes netiek uztvertas kā kaitīgas vai aizskarošas. Tāpat Deepmind's Sparrow Rules nosaka, ka tērzēšanas robots atbild ar atbildēm, kuru mērķis ir veidot attiecības ar lietotāju.

Antropiskās izpētes 1. un 2. komplekta iekļaušana nodrošina galīgo garantiju, ka AI sarunas joprojām ir pilsoniskas un cieņpilnas. AI ir apmācīts, lai nodrošinātu, ka tas atbild uz jautājumiem pārdomāti un pieklājīgi.

Kopumā Anthropic “Contextual AI” modelis ir neticami svarīgs sasniegums AI pētījumi. Ļaujot AI mācīt saskaņā ar principiem, kas iegūti no tik daudzveidīgiem avotiem, tiek ievērojami uzlabota automatizēto sarunu ētiskā ietekme.

Lasiet vairāk par AI:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Vairāk rakstus
Damirs Jalalovs
Damirs Jalalovs

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē. 

Hot Stories
Pievienojieties mūsu informatīvajam izdevumam.
Jaunākās ziņas

Nepastāvības apstākļos institucionālā apetīte pieaug pret Bitcoin ETF

Informācijas atklāšana, izmantojot 13F pieteikumus, atklāj ievērojamus institucionālos investorus, kas iesaistās Bitcoin ETF, uzsverot pieaugošo pieņemšanu ...

Uzziniet vairāk

Pienāk notiesāšanas diena: CZ liktenis ir līdzsvarā, jo ASV tiesa izskata DOJ lūgumu

Šodien ASV tiesā Sietlā Čanpens Džao ir gatavs notiesāt.

Uzziniet vairāk
Pievienojieties mūsu novatoriskajai tehnoloģiju kopienai
Lasīt vairāk
Vairāk
Injective apvieno spēkus ar AltLayer, lai nodrošinātu atkārtotu inEVM drošību
bizness Ziņojums Tehnoloģija
Injective apvieno spēkus ar AltLayer, lai nodrošinātu atkārtotu inEVM drošību
3. gada 2024. maijs
Masa sadarbojas ar Teller, lai ieviestu MASA aizdevumu fondu, ļaujot USDC aizņemties bāzē
Markets Ziņojums Tehnoloģija
Masa sadarbojas ar Teller, lai ieviestu MASA aizdevumu fondu, ļaujot USDC aizņemties bāzē
3. gada 2024. maijs
Velodrome nākamajās nedēļās izlaiž Superchain Beta versiju un izvēršas visās OP Stack Layer 2 blokķēdes
Markets Ziņojums Tehnoloģija
Velodrome nākamajās nedēļās izlaiž Superchain Beta versiju un izvēršas visās OP Stack Layer 2 blokķēdes
3. gada 2024. maijs
CARV paziņo par sadarbību ar Aethir, lai decentralizētu savu datu slāni un sadalītu atlīdzības
bizness Ziņojums Tehnoloģija
CARV paziņo par sadarbību ar Aethir, lai decentralizētu savu datu slāni un sadalītu atlīdzības
3. gada 2024. maijs
CRYPTOMERIA LABS PTE. LTD.