Nyheds rapport SMW Teknologier
Maj 10, 2023

Anthropic foreslår en 'kontekstuel AI' til chatmodeller baseret på 60 principper

Kort sagt

OpenAI bruger forstærkende læring fra menneskelig feedback (RLHF) til at justere sprogmodeller med menneskelige principper, sikkerhed og anvendelighed.

Anthropic foreslog en alternativ tilgang: kontekstuel AI, som involverer folk, der skriver en forfatning, som modellen skal følge.

Denne forfatning er baseret på De Forenede Nationers menneskerettighedserklæring, Apples servicevilkår, principper, der tilskynder til overvejelse af ikke-vestlige perspektiver.

Anthropic har foreslået en ny tilgang til træning af chatmodeller ved hjælp af 'Konstitutionel AI'. Denne metode bygger videre på OpenAI's forstærkning læring fra menneskelig feedback, men bygger på det ved at undgå behovet for at skrive dybe træningsprøver. I stedet er modellen trænet til at reagere på input gennem brug af en forfatning, som er beregnet til at fungere som et sæt love, som modellen skal følge.

Anthropic foreslår en 'kontekstuel AI' til chatmodeller baseret på 60 principper
anthropic.com
Anbefalet: ex-OpenAI ansatte grundlagde Anthropic, en virksomhed, der har tiltrukket over $700 millioner i finansiering

Gennem denne metode kan AI generere sine egne træningsprøver ved at evaluere, hvad den har sagt i forhold til sit sæt af juridisk accepterede principper. Denne tidsbesparende teknik kan ses som Isaac Asimov's Robotikkens love føre ud i livet.

De principper, som danner grundlaget for modellen, er for mange til at kunne diskuteres i detaljer. De dækker dog mange emner, såsom moral, risikoaversion, økonomi og kunstig intelligens. Hver er udviklet for at hjælpe med at guide AI's beslutninger, når det kommer til at reagere på samtaleopfordringer.

Anthropic har formået effektivt at træne en AI-model ved navn Claude, som med succes konkurrerer med OpenAI's ChatGPT. Bruger Constitution-AI metode, kunne Claude reagere på samtaleopfordringer med et imponerende niveau af nøjagtighed, men yderligere forbedringer forventes, da Anthropic fortsætter med at bygge videre på denne spilskiftende teknologi.

Ved hjælp af principperne og nogle få proceseksempler undervises modellen i, hvordan man evaluerer og reviderer sine egne svar gennem den første fase. Den anden fase involverer træning af en model ved hjælp af forstærkningslæring, men i stedet for at bruge input fra mennesker, bruger den AI-genereret feedback baseret på et sæt principper til at vælge det mere godartede output.

Faktisk har denne nye tilgang potentiale til at spare tid og penge for virksomheder, der ikke længere behøver at konstruere deres egne træningsprøver. Tværtimod kan denne 'færdige' metode bruges som grundlag for at skabe tilpassede modeller - ingen programmeringskendskab er påkrævet. Det er også vigtigt at bemærke, hvordan denne teknologi også lover at øge sikkerheden, når det kommer til samtalebots. Oprettelse af et sæt af juridisk accepterede principper mindsker risikoen af AI bliver slyngel.

Derfor lover Constituation AI ikke kun at gøre udvikling af chatmodeller nemmere og hurtigere, men det vil også gøre det mere sikkert. En win-win situation for både kunstig intelligens og ChatBots.

Et analytisk kig på Anthropics "Contextual AI" for Chatbots

Anthropics Contextual AI er baseret på inkorporering af mere end 60 principper, der stammer fra FN's Menneskerettighedserklæring, Apples servicevilkår, principper, der tilskynder til overvejelse af ikke-vestlige perspektiver, Deepmind's Sparrow Rules og antropisk forskningssæt 1 og sæt 2.

Den kendsgerning, at AI nu kan læres at opføre sig i overensstemmelse med principper, der stammer fra en så omfattende og mangfoldig række af kilder, er virkelig bemærkelsesværdig. Ved at inkorporere principper fra FN's Menneskerettighedserklæring, for eksempel, afspejler chatbot-svar nu vigtigheden af ​​at bevare begrebet frihed, lighed og broderskab. Sådanne principper er en afgørende komponent for at sikre dette chatbot-samtaler forbliv etisk og respektfuldt. Ligeledes sikrer inkorporeringen af ​​Apples Servicevilkår chatbot tager hensyn til sine brugeres privatlivsinteresser.

Principper, der tilskynder til overvejelse af ikke-vestlige perspektiver, spiller også en vigtig rolle i "Kontekstuel AI"-modellen. Disse principper afspejler behovet for, at AI skal respektere andre kulturer og sikre, at chatbot-svar ikke opfattes som værende skadelige eller stødende. Tilsvarende dikterer Deepmind's Sparrow-regler, at chatbotten svarer med svar, der har til formål at opbygge et forhold til brugeren.

Inkorporeringen af ​​antropisk forskningssæt 1 og sæt 2 giver den endelige garanti for, at AI-samtaler forbliver civile og respektfulde. AI'en er trænet til at sikre, at den besvarer spørgsmål på en tankevækkende og høflig måde.

Alt i alt er Anthropics "Contextual AI"-model et utroligt vigtigt gennembrud inden for AI forskning. Ved at tillade AI at blive undervist i henhold til principper, der stammer fra så mange forskellige kilder, forbedres de etiske implikationer af automatiserede samtaler betydeligt.

Læs mere om AI:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Flere artikler
Damir Yalalov
Damir Yalalov

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab. 

Hot Stories
Tilmeld dig vores nyhedsbrev.
Seneste Nyheder

Institutionel appetit vokser mod Bitcoin ETF'er midt i volatilitet

Afsløringer gennem 13F-arkivering afslører bemærkelsesværdige institutionelle investorer, der dytter i Bitcoin ETF'er, hvilket understreger en voksende accept af ...

Vide mere

Straffeudmålingsdagen ankommer: CZ's skæbne hænger i balance, da amerikansk domstol overvejer DOJ's anbringende

Changpeng Zhao står klar til at blive dømt ved en amerikansk domstol i Seattle i dag.

Vide mere
Tilmeld dig vores innovative teknologifællesskab
Læs mere
Læs mere
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Forretning Nyheds rapport Teknologier
Injective slår sig sammen med AltLayer for at give inEVM genskabende sikkerhed
Maj 3, 2024
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Markeder Nyheds rapport Teknologier
Masa går sammen med Teller for at introducere MASA Lending Pool, muliggør USDC-lån på base
Maj 3, 2024
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Markeder Nyheds rapport Teknologier
Velodrome lancerer Superchain Beta-version i de kommende uger og udvider på tværs af OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Forretning Nyheds rapport Teknologier
CARV annoncerer partnerskab med Aethir for at decentralisere sit datalag og uddele belønninger
Maj 3, 2024