10. gada 2023. maijs

Anthropic ierosina "kontekstuālo AI" tērzēšanas modeļiem, pamatojoties uz 60 principiem

Publicēts: 10. gada 2023. maijā plkst. 4:24 Atjaunināts: 10. gada 2023. maijā plkst. 4:25

Rediģēts un pārbaudīts ar faktu: 10. gada 2023. maijs, plkst. 4:24

Īsumā

OpenAI izmanto pastiprināšanas mācīšanos no cilvēka atgriezeniskās saites (RLHF), lai izlīdzinātu valodu modeļi ar cilvēciskajiem principiem, drošību un lietderību.

Anthropic ierosināja alternatīvu pieeju: kontekstuālo AI, kurā cilvēki raksta konstitūciju, kas modelim būtu jāievēro.

Šī konstitūcija ir balstīta uz Apvienoto Nāciju Organizācijas Cilvēktiesību deklarāciju, Apple pakalpojumu noteikumiem, principiem, kas mudina ņemt vērā ne-Rietumu perspektīvas.

Anthropic ir ierosinājis jaunu pieeju tērzēšanas modeļu apmācībai, izmantojotKonstitucionālais AI'. Šī metode balstās uz OpenAI'S pastiprināt mācīšanās no cilvēku atsauksmēm, bet balstās uz to, izvairoties no nepieciešamības rakstīt dziļus apmācības paraugus. Tā vietā modelis ir apmācīts reaģēt uz ievadi, izmantojot konstitūciju, kas ir paredzēta kā likumu kopums, kas modelim jāievēro.

Anthropic ierosina "kontekstuālo AI" tērzēšanas modeļiem, pamatojoties uz 60 principiem — anthropic.com

Ieteicams: Ex-OpenAI darbinieki nodibināja Anthropic, uzņēmumu, kas ir piesaistījis vairāk nekā 700 miljonus USD finansējumu

Izmantojot šo metodi, mākslīgais intelekts var ģenerēt savus apmācības paraugus, izvērtējot teikto salīdzinājumā ar juridiski pieņemto principu kopumu. Šo laiku taupošo paņēmienu var uzskatīt par Isaac Asimovs Robotikas likumi īstenot praksē.

Principu, kas veido modeļa pamatu, ir pārāk daudz, lai tos detalizēti apspriestu. Tomēr tie aptver daudzas tēmas, piemēram, morāli, izvairīšanos no riska, ekonomiku un mākslīgo intelektu. Katrs no tiem ir izstrādāts, lai palīdzētu vadīt AI lēmumus, reaģējot uz tiem sarunvalodas uzvednes.

Anthropic ir izdevies efektīvi apmācīt AI modeli ar nosaukumu Klods, kurš veiksmīgi konkurē ar OpenAI'S ChatGPT. Izmantojot Konstitūcijas-AI metode, Klods varētu reaģēt uz sarunvalodas uzvednēm ar iespaidīgu precizitātes līmeni, taču ir sagaidāmi papildu uzlabojumi, jo Anthropic turpina pilnveidot šo spēli mainošo tehnoloģiju.

Izmantojot principu kopumu un dažus procesa piemērus, modelis tiek mācīts, kā novērtēt un pārskatīt savas atbildes pirmajā posmā. Otrajā posmā tiek apmācīts modelis, izmantojot pastiprinošu mācīšanos, bet tā vietā, lai izmantotu cilvēku sniegto informāciju, tā izmanto AI ģenerētu atgriezenisko saiti, pamatojoties uz principu kopumu, lai atlasītu labvēlīgāku rezultātu.

Patiešām, šī jaunā pieeja var ietaupīt laiku un naudu uzņēmumiem, kuriem vairs nebūs jāveido savi apmācību paraugi. Drīzāk šo “gatavu” metodi var izmantot kā pamatu pielāgotu modeļu izveidei — nav nepieciešamas programmēšanas zināšanas. Ir arī svarīgi atzīmēt, kā šī tehnoloģija arī sola palielināt drošību, kad runa ir par sarunu robotiem. Juridiski pieņemtu principu kopuma izveide samazina risku AI kļūst negodīgi.

Tāpēc Constituation AI sola ne tikai padarīt tērzēšanas modeļa izstrādi vieglāku un ātrāku, bet arī padarīs to drošāku. Abpusēji izdevīga situācija gan mākslīgā intelekta, gan tērzēšanas robotu pasaulei.

Analītisks skatījums uz Anthropic “kontekstuālo AI” tērzēšanas robotiem

Anthropic kontekstuālā AI pamatā ir vairāk nekā 60 principu, kas izriet no Apvienoto Nāciju Organizācijas Cilvēktiesību deklarācijas, Apple pakalpojumu sniegšanas noteikumiem, principiem, kas mudina ņemt vērā ne-Rietumu perspektīvas, iekļaušanu, Deepmind's Zvirbuļu noteikumi un antropiskās izpētes 1. un 2. komplekts.

Fakts, ka AI tagad var iemācīt rīkoties saskaņā ar principiem, kas izriet no tik plaša un daudzveidīga avotu klāsta, ir patiesi ievērojams. Iekļaujot, piemēram, Apvienoto Nāciju Organizācijas Cilvēktiesību deklarācijas principus, tērzēšanas robotu atbildes tagad atspoguļo brīvības, vienlīdzības un brālības jēdziena saglabāšanas nozīmi. Šādi principi ir būtiska sastāvdaļa, lai to nodrošinātu chatbot sarunas palikt ētiski un cieņpilni. Tāpat Apple pakalpojumu sniegšanas noteikumu iekļaušana nodrošina chatbot ņem vērā savu lietotāju privātuma intereses.

Principi, kas mudina ņemt vērā ne-Rietumu perspektīvas, arī spēlē nozīmīgu lomu “Kontekstuālā AI” modelī. Šie principi atspoguļo nepieciešamību AI cienīt citas kultūras un nodrošināt, ka tērzēšanas robotu atbildes netiek uztvertas kā kaitīgas vai aizskarošas. Tāpat Deepmind's Sparrow Rules nosaka, ka tērzēšanas robots atbild ar atbildēm, kuru mērķis ir veidot attiecības ar lietotāju.

Antropiskās izpētes 1. un 2. komplekta iekļaušana nodrošina galīgo garantiju, ka AI sarunas joprojām ir pilsoniskas un cieņpilnas. AI ir apmācīts, lai nodrošinātu, ka tas atbild uz jautājumiem pārdomāti un pieklājīgi.

Kopumā Anthropic “Contextual AI” modelis ir neticami svarīgs sasniegums AI pētījumi. Ļaujot AI mācīt saskaņā ar principiem, kas iegūti no tik daudzveidīgiem avotiem, tiek ievērojami uzlabota automatizēto sarunu ētiskā ietekme.

Lasiet vairāk par AI:

Tags:

Atbildības noraidīšana

Atbilstīgi Uzticības projekta vadlīnijas, lūdzu, ņemiet vērā, ka šajā lapā sniegtā informācija nav paredzēta un to nedrīkst interpretēt kā juridisku, nodokļu, ieguldījumu, finanšu vai jebkāda cita veida padomu. Ir svarīgi ieguldīt tikai to, ko varat atļauties zaudēt, un meklēt neatkarīgu finanšu padomu, ja jums ir šaubas. Lai iegūtu papildinformāciju, iesakām skatīt pakalpojumu sniegšanas noteikumus, kā arī palīdzības un atbalsta lapas, ko nodrošina izdevējs vai reklāmdevējs. MetaversePost ir apņēmies sniegt precīzus, objektīvus pārskatus, taču tirgus apstākļi var tikt mainīti bez iepriekšēja brīdinājuma.

Par Autors

Damirs ir komandas vadītājs, produktu vadītājs un redaktors Metaverse Post, kas aptver tādas tēmas kā AI/ML, AGI, LLM, Metaverse un Web3- saistītie lauki. Viņa raksti katru mēnesi piesaista lielu auditoriju, kas pārsniedz miljonu lietotāju. Šķiet, ka viņš ir eksperts ar 10 gadu pieredzi SEO un digitālā mārketinga jomā. Damirs ir minēts Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto un citas publikācijas. Viņš ceļo starp AAE, Turciju, Krieviju un NVS kā digitālais nomads. Damirs ir ieguvis bakalaura grādu fizikā, kas, viņaprāt, ir devis viņam kritiskās domāšanas prasmes, kas nepieciešamas, lai gūtu panākumus nepārtraukti mainīgajā interneta vidē.

Vairāk rakstus

Damirs Jalalovs