Naujienų ataskaita SMW Technologija
Gali 10, 2023

„Anthropic“ siūlo „kontekstinį AI“ pokalbių modeliams, pagrįstą 60 principų

Trumpai

OpenAI suderinimui naudoja mokymąsi iš žmogaus grįžtamojo ryšio (RLHF). kalbos modeliai su žmogiškaisiais principais, saugumu ir naudingumu.

Antropikas pasiūlė alternatyvų požiūrį: kontekstinį AI, į kurį įtraukiami žmonės, rašantys konstituciją, kurios modelis turėtų vadovautis.

Ši konstitucija remiasi Jungtinių Tautų žmogaus teisių deklaracija, Apple paslaugų teikimo sąlygomis, principais, skatinančiais atsižvelgti į ne vakarietiškas perspektyvas.

Anthropic pasiūlė naują požiūrį į pokalbių modelių mokymą naudojant "Konstitucinis AI“. Šis metodas remiasi OpenAIS stiprinimas remiantis žmonių atsiliepimais, bet remiasi jais, vengiant būtinybės rašyti gilius mokymo pavyzdžius. Vietoj to, modelis yra išmokytas reaguoti į indėlį naudojant konstituciją, kuri turi veikti kaip įstatymų rinkinys, kuriuo modelis turi vadovautis.

„Anthropic“ siūlo „kontekstinį AI“ pokalbių modeliams, pagrįstą 60 principų
anthropic.com
Rekomenduojama: Ex-OpenAI darbuotojų įkūrė Anthropic – verslą, pritraukusį per 700 mln

Taikydamas šį metodą AI gali sukurti savo mokymo pavyzdžius, įvertindamas tai, ką pasakė, palyginti su teisiškai priimtų principų rinkiniu. Šią laiką taupančią techniką galima vertinti kaip Isaac Asimov's Robotikos dėsniai naudoti praktikoje.

Principų, sudarančių modelio pagrindą, yra per daug, kad juos būtų galima išsamiai aptarti. Tačiau jie apima daugybę temų, tokių kaip moralė, rizikos vengimas, ekonomika ir dirbtinis intelektas. Kiekvienas iš jų buvo sukurtas siekiant padėti AI priimti sprendimus, kai reikia reaguoti pokalbio raginimai.

Anthropic pavyko efektyviai išmokyti dirbtinio intelekto modelį, vardu Claude, kuris sėkmingai konkuruoja OpenAIS ChatGPT. Naudojant Konstitucijos-AI metodas, Claude'as galėtų reaguoti į pokalbio raginimus įspūdingu tikslumo lygiu, tačiau tikimasi papildomų patobulinimų, nes Anthropic ir toliau kuria šią žaidimą keičiančią technologiją.

Naudojant principų rinkinį ir kelis proceso pavyzdžius, modelis mokomas, kaip įvertinti ir peržiūrėti savo atsakymus per pirmąjį etapą. Antrasis etapas apima modelio mokymą, naudojant sustiprintą mokymąsi, tačiau užuot naudojęs žmonių indėliu, jis naudoja dirbtinio intelekto sugeneruotą grįžtamąjį ryšį, pagrįstą principų rinkiniu, kad pasirinktų geresnę išvestį.

Iš tiesų, šis naujas požiūris gali sutaupyti laiko ir pinigų įmonėms, kurioms nebereikės kurti savo mokymo pavyzdžių. Atvirkščiai, šis „paruoštas“ metodas gali būti naudojamas kaip pagrindas kuriant pritaikytus modelius – nereikia jokių programavimo žinių. Taip pat svarbu pažymėti, kad ši technologija taip pat žada padidinti saugumą kalbant apie pokalbių robotus. Sukurti teisiškai priimtų principų rinkinį sumažina riziką AI daro nesąžiningus.

Todėl „Constituation AI“ ne tik žada palengvinti ir pagreitinti pokalbių modelio kūrimą, bet ir padaryti jį saugesnį. Visiems naudinga situacija dirbtinio intelekto ir pokalbių robotų pasauliui.

Analitinis žvilgsnis į Anthropic „kontekstinį AI“, skirtą pokalbių robotams

Anthropic kontekstinis AI pagrįstas daugiau nei 60 principų, išvestų iš Jungtinių Tautų žmogaus teisių deklaracijos, Apple paslaugų teikimo sąlygų, principų, skatinančių atsižvelgti į ne Vakarų perspektyvas, Deepmind's Žvirblio taisyklės ir antropiniai tyrimai 1 ir 2 rinkiniai.

Tai, kad dirbtinis intelektas dabar gali būti išmokytas elgtis pagal principus, kilusius iš tokio plataus ir įvairių šaltinių, yra tikrai nuostabus. Pavyzdžiui, įtraukus principus iš Jungtinių Tautų žmogaus teisių deklaracijos, pokalbių robotų atsakymai dabar atspindi laisvės, lygybės ir brolybės sampratos išsaugojimo svarbą. Tokie principai yra esminis to užtikrinimo komponentas „chatbot“ pokalbiai išlikti etiški ir pagarbūs. Taip pat Apple paslaugų teikimo sąlygų įtraukimas užtikrina pokalbis atsižvelgia į savo vartotojų privatumo interesus.

Principai, skatinantys atsižvelgti į ne vakarietiškas perspektyvas, taip pat vaidina svarbų vaidmenį „kontekstinio AI“ modelyje. Šie principai atspindi AI poreikį gerbti kitas kultūras ir užtikrinti, kad pokalbių robotų atsakymai nebūtų suvokiami kaip žalingi ar įžeidžiantys. Panašiai Deepmind's Sparrow Rules diktuoja, kad pokalbių robotas atsakytų atsakymais, kuriais siekiama užmegzti ryšį su vartotoju.

Antropinių tyrimų 1 ir 2 rinkinių įtraukimas suteikia galutinę garantiją, kad AI pokalbiai išliks pilietiški ir pagarbūs. AI yra apmokytas užtikrinti, kad į klausimus atsakytų apgalvotai ir mandagiai.

Apskritai Anthropic „kontekstinis AI“ modelis yra nepaprastai svarbus laimėjimas AI tyrimai. Leidžiant dirbtinio intelekto mokymą pagal principus, gautus iš tokių įvairių šaltinių, etinis automatizuotų pokalbių poveikis labai pagerėjo.

Skaitykite daugiau apie AI:

Atsakomybės neigimas

Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.

Apie autorių

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Daugiau straipsnių
Damiras Jalalovas
Damiras Jalalovas

Damiras yra komandos vadovas, produktų vadovas ir redaktorius Metaverse Post, apimantis tokias temas kaip AI/ML, AGI, LLM, Metaverse ir Web3– susijusiose srityse. Jo straipsniai kas mėnesį pritraukia didžiulę daugiau nei milijono vartotojų auditoriją. Atrodo, kad jis yra ekspertas, turintis 10 metų SEO ir skaitmeninės rinkodaros patirtį. Damiras buvo paminėtas Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ir kiti leidiniai. Jis keliauja tarp JAE, Turkijos, Rusijos ir NVS kaip skaitmeninis klajoklis. Damiras įgijo fizikos bakalauro laipsnį, kuris, jo manymu, suteikė jam kritinio mąstymo įgūdžių, reikalingų sėkmingam nuolat besikeičiančiame interneto peizaže. 

Institucinis apetitas Bitcoin ETF atžvilgiu auga dėl nepastovumo

13F paraiškų atskleidimas atskleidžia žymius institucinius investuotojus, kurie naudojasi Bitcoin ETF, o tai rodo, kad vis labiau pritariama...

Žinoti daugiau

Ateina nuosprendžio paskelbimo diena: CZ likimas subalansuotas, nes JAV teismas svarsto DOJ prašymą

Changpeng Zhao šiandien laukia nuosprendžio JAV teisme Sietle.

Žinoti daugiau
Prisijunkite prie mūsų naujoviškų technologijų bendruomenės
Skaityti daugiau
Skaityti daugiau
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Atsakingas verslas Naujienų ataskaita Technologija
Injective sujungia jėgas su AltLayer, kad padidintų inEVM saugumą
Gali 3, 2024
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
rinkos Naujienų ataskaita Technologija
„Masa“ bendradarbiauja su „Teller“, kad pristatytų MASA skolinimo fondą, leidžiantį skolintis USDC pagrindu
Gali 3, 2024
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
rinkos Naujienų ataskaita Technologija
„Velodrome“ ateinančiomis savaitėmis pristato „Superchain“ beta versiją ir išplečiama visose „OP Stack Layer 2 Blockchains“
Gali 3, 2024
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Atsakingas verslas Naujienų ataskaita Technologija
CARV praneša apie partnerystę su Aethir, kad decentralizuotų savo duomenų sluoksnį ir paskirstytų atlygį
Gali 3, 2024
CRYPTOMERIA LABS PTE. LTD.