Novice SMW Tehnologija
Maj 10, 2023

Anthropic predlaga 'kontekstualno umetno inteligenco' za modele klepeta, ki temelji na 60 načelih

Na kratko

OpenAI za uskladitev uporablja okrepitveno učenje iz človeških povratnih informacij (RLHF). jezikovni modeli s človeškimi načeli, varnostjo in uporabnostjo.

Anthropic je predlagal alternativni pristop: kontekstualno umetno inteligenco, ki vključuje ljudi, ki pišejo ustavo, ki bi ji model moral slediti.

Ta ustava temelji na Deklaraciji Združenih narodov o človekovih pravicah, Applovih pogojih storitve, načelih, ki spodbujajo upoštevanje nezahodnih perspektiv.

Anthropic je predlagal nov pristop k usposabljanju modelov klepeta z uporabo "Ustavna umetna inteligenca'. Ta metoda temelji na OpenAIJe okrepljeno učenje iz človeških povratnih informacij, vendar jih nadgrajuje tako, da se izogne ​​potrebi po pisanju globokih vzorcev usposabljanja. Namesto tega je model usposobljen za odziv na vnos z uporabo ustave, ki naj bi delovala kot nabor zakonov, ki jim mora model slediti.

Anthropic predlaga 'kontekstualno umetno inteligenco' za modele klepeta, ki temelji na 60 načelih
anthropic.com
Priporočamo: bivšiOpenAI zaposleni so ustanovili podjetje Anthropic, ki je pritegnilo več kot 700 milijonov dolarjev financiranja

S to metodo lahko umetna inteligenca ustvari lastne vzorce usposabljanja tako, da oceni, kar je povedala, v primerjavi z nizom zakonsko sprejetih načel. To tehniko prihranka časa lahko razumemo kot Isaac Asimovje Zakoni robotike izvajati v praksi.

Načel, ki tvorijo osnovo modela, je preveč, da bi jih podrobneje obravnavali. Vendar pa pokrivajo številne teme, kot so morala, nenaklonjenost tveganju, ekonomija in umetna inteligenca. Vsak je bil razvit za pomoč pri odločitvah umetne inteligence, ko se je treba odzvati pogovorne namige.

Anthropic je uspel učinkovito usposobiti model AI z imenom Claude, ki mu uspešno konkurira OpenAIJe ChatGPT. Uporabljati Metoda Constitution-AI, bi se Claude lahko odzival na pogovorne pozive z impresivno stopnjo natančnosti, vendar se pričakujejo dodatne izboljšave, saj Anthropic še naprej gradi na tej tehnologiji, ki spreminja igro.

Z uporabo nabora načel in nekaj primerov postopkov se model nauči, kako oceniti in revidirati lastne odgovore v prvi fazi. Druga stopnja vključuje usposabljanje modela z uporabo učenja z okrepitvijo, vendar namesto uporabe vnosa ljudi uporablja povratne informacije, ki jih ustvari umetna inteligenca in temeljijo na naboru načel, da izberejo bolj benigne rezultate.

Dejansko lahko ta novi pristop prihrani čas in denar za podjetja, ki jim ne bo več treba sestavljati lastnih vzorcev usposabljanja. Namesto tega lahko to 'pripravljeno' metodo uporabimo kot osnovo za ustvarjanje modelov po meri – znanje programiranja ni potrebno. Pomembno je tudi omeniti, da ta tehnologija obljublja tudi večjo varnost, ko gre za pogovorne robote. Ustvarjanje sklopa pravno sprejetih načel zmanjša tveganje umetne inteligence, ki postaja lopov.

Zato Constitution AI ne samo obljublja, da bo razvoj modela klepeta naredil lažji in hitrejši, ampak ga bo naredil tudi varnejšega. Zmagajoča situacija za svet umetne inteligence in ChatBotov.

Analitični pogled na Anthropicov »kontekstualni AI« za klepetalnice

Kontekstualna umetna inteligenca podjetja Anthropic temelji na vključevanju več kot 60 načel, ki izhajajo iz Deklaracije Združenih narodov o človekovih pravicah, Applovih pogojev storitve, načel, ki spodbujajo upoštevanje nezahodnih perspektiv, Deepmindovega Sparrow Rules in antropske raziskave, sklop 1 in sklop 2.

Dejstvo, da je AI zdaj mogoče naučiti, da se obnaša v skladu z načeli, ki izhajajo iz tako obsežnega in raznolikega nabora virov, je resnično izjemno. Z vključitvijo načel iz Deklaracije Združenih narodov o človekovih pravicah, na primer, odzivi chatbotov zdaj odražajo pomen ohranjanja pojma svobode, enakosti in bratstva. Takšna načela so ključnega pomena za zagotavljanje tega chatbot pogovori ostanite etični in spoštljivi. Prav tako vključitev Applovih pogojev storitve zagotavlja chatbot upošteva interese zasebnosti svojih uporabnikov.

Načela, ki spodbujajo upoštevanje nezahodnih perspektiv, prav tako igrajo pomembno vlogo v modelu »kontekstualne umetne inteligence«. Ta načela odražajo potrebo, da umetna inteligenca spoštuje druge kulture in zagotavlja, da se odzivi klepetalnih robotov ne dojemajo kot škodljivi ali žaljivi. Podobno Deepmind's Sparrow Rules narekuje, da se chatbot odzove z odgovori, namenjenimi vzpostavitvi odnosa z uporabnikom.

Vključitev Anthropic Research Set 1 in Set 2 zagotavlja končno jamstvo, da pogovori AI ostanejo vljudni in spoštljivi. Umetna inteligenca je usposobljena tako, da na vprašanja odgovarja na premišljen in vljuden način.

Na splošno je Anthropicov model »kontekstualne umetne inteligence« izjemno pomemben preboj na področju Raziskave AI. Z omogočanjem poučevanja umetne inteligence v skladu z načeli, ki izhajajo iz tako raznolikih virov, so etične posledice avtomatiziranih pogovorov močno izboljšane.

Preberite več o AI:

Zavrnitev odgovornosti

V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.

O avtorju

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

več člankov
Damir Yalalov
Damir Yalalov

Damir je vodja ekipe, produktni vodja in urednik pri Metaverse Post, ki pokriva teme, kot so AI/ML, AGI, LLMs, Metaverse in Web3- sorodna področja. Njegovi članki vsak mesec pritegnejo množično občinstvo več kot milijon uporabnikov. Zdi se, da je strokovnjak z 10-letnimi izkušnjami na področju SEO in digitalnega trženja. Damir je bil omenjen v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto in druge publikacije. Kot digitalni nomad potuje med ZAE, Turčijo, Rusijo in SND. Damir je diplomiral iz fizike, kar mu je po njegovem mnenju dalo sposobnosti kritičnega razmišljanja, potrebne za uspeh v nenehno spreminjajočem se okolju interneta. 

Institucionalni apetit raste proti Bitcoin ETF-jem sredi volatilnosti

Razkritja prek vlog 13F razkrivajo pomembne institucionalne vlagatelje, ki se ukvarjajo z Bitcoin ETF, kar poudarja vse večje sprejemanje ...

Več o tem

Prihaja dan obsodbe: usoda CZ visi na ravnovesju, ko ameriško sodišče obravnava tožbeni razlog DOJ

Changpeng Zhao se danes sooča z obsodbo na ameriškem sodišču v Seattlu.

Več o tem
Pridružite se naši inovativni tehnološki skupnosti
Preberi več
Preberi več
Injective združuje moči z AltLayer, da bi v inEVM prinesel varnost preoblikovanja
ŽELITE POSTATI PARTNER Novice Tehnologija
Injective združuje moči z AltLayer, da bi v inEVM prinesel varnost preoblikovanja
Maj 3, 2024
Masa se združuje s podjetjem Teller, da uvede MASA Lending Pool, ki omogoča izposojo USDC na osnovi
Prisotnost Novice Tehnologija
Masa se združuje s podjetjem Teller, da uvede MASA Lending Pool, ki omogoča izposojo USDC na osnovi
Maj 3, 2024
Velodrome v prihodnjih tednih lansira različico Superchain Beta in se širi po verigah blokov plasti 2 sklada OP
Prisotnost Novice Tehnologija
Velodrome v prihodnjih tednih lansira različico Superchain Beta in se širi po verigah blokov plasti 2 sklada OP
Maj 3, 2024
CARV napoveduje partnerstvo z Aethirjem za decentralizacijo njegove podatkovne plasti in razdeljevanje nagrad
ŽELITE POSTATI PARTNER Novice Tehnologija
CARV napoveduje partnerstvo z Aethirjem za decentralizacijo njegove podatkovne plasti in razdeljevanje nagrad
Maj 3, 2024
CRYPTOMERIA LABS PTE. LTD.