Nyhetsrapport SMW Teknologi
Maj 10, 2023

Anthropic föreslår en "kontextuell AI" för chattmodeller baserat på 60 principer

I korthet

OpenAI använder förstärkningsinlärning från mänsklig feedback (RLHF) för att anpassa språkmodeller med mänskliga principer, säkerhet och användbarhet.

Anthropic föreslog ett alternativt tillvägagångssätt: kontextuell AI, som innebär att människor skriver en konstitution som modellen bör följa.

Denna konstitution är baserad på FN:s deklaration om mänskliga rättigheter, Apples användarvillkor, principer som uppmuntrar hänsyn till icke-västerländska perspektiv.

Anthropic har föreslagit ett nytt tillvägagångssätt för att träna chattmodeller med hjälp av 'Konstitutionell AI'. Denna metod bygger på OpenAIÄr förstärkning lärande från mänsklig feedback men bygger vidare på den genom att undvika behovet av att skriva djupa träningsprov. Istället är modellen tränad att svara på input genom att använda en konstitution som är tänkt att fungera som en uppsättning lagar för modellen att följa.

Anthropic föreslår en "kontextuell AI" för chattmodeller baserat på 60 principer
anthropic.com
Rekommenderas: ex-OpenAI anställda grundade Anthropic, ett företag som har fått över 700 miljoner dollar i finansiering

Genom denna metod kan AI generera sina egna träningsprov genom att utvärdera vad den har sagt kontra dess uppsättning juridiskt accepterade principer. Denna tidsbesparande teknik kan ses som Isaac Asimov's Robotics Laws sätta i verket.

Principerna som ligger till grund för modellen är för många för att diskutera i detalj. Men de täcker många ämnen, såsom moral, riskaversion, ekonomi och artificiell intelligens. Var och en har utvecklats för att hjälpa till att styra AI:s beslut när det gäller att svara på samtalsuppmaningar.

Anthropic har lyckats effektivt träna en AI-modell vid namn Claude, som framgångsrikt konkurrerar med OpenAIÄr ChatGPT. Använda Konstitution-AI-metodenClaude kunde svara på samtalsuppmaningar med en imponerande noggrannhetsnivå, men ytterligare förbättringar förväntas när Anthropic fortsätter att bygga på denna spelförändrande teknologi.

Med hjälp av uppsättningen principer och några processexempel lär modellen ut hur man utvärderar och reviderar sina egna svar under den första fasen. Det andra steget innebär att man tränar en modell med hjälp av förstärkningsinlärning, men istället för att använda input från människor använder den AI-genererad feedback baserad på en uppsättning principer för att välja den mer godartade effekten.

Detta nya tillvägagångssätt har faktiskt potential att spara tid och pengar för företag som inte längre behöver konstruera sina egna utbildningsexemplar. Snarare kan denna "färdiga" metod användas som grund för att skapa skräddarsydda modeller - inga programmeringskunskaper krävs. Det är också viktigt att notera hur denna teknik också lovar att öka säkerheten när det kommer till konversationsbotar. Skapa en uppsättning juridiskt accepterade principer minskar risken av AI:n blir skurk.

Därför lovar Constituation AI inte bara att göra utvecklingen av chattmodeller enklare och snabbare, utan det kommer också att göra det säkrare. En win-win-situation för både artificiell intelligens och ChatBots.

En analytisk titt på Anthropics "Contextual AI" för chatbots

Anthropics Contextual AI är baserad på att införliva mer än 60 principer härledda från FN:s deklaration om mänskliga rättigheter, Apples användarvillkor, principer som uppmuntrar hänsyn till icke-västerländska perspektiv, Deepminds Sparrow Rules och antropisk forskningsuppsättning 1 och uppsättning 2.

Det faktum att AI nu kan läras att bete sig enligt principer som härrör från ett så omfattande och mångsidigt utbud av källor är verkligen anmärkningsvärt. Genom att införliva principer från FN:s deklaration om mänskliga rättigheter, till exempel, återspeglar chatbot-svar nu vikten av att bevara föreställningen om frihet, jämlikhet och broderskap. Sådana principer är en viktig komponent för att säkerställa detta chatbot-konversationer förbli etisk och respektfull. På samma sätt säkerställer införlivandet av Apples användarvillkor chatbot tar hänsyn till användarnas integritetsintressen.

Principer som uppmuntrar övervägande av icke-västerländska perspektiv spelar också en viktig roll i den "kontextuella AI"-modellen. Dessa principer återspeglar behovet av AI att respektera andra kulturer och säkerställa att chatbot-svar inte uppfattas som skadliga eller stötande. På liknande sätt dikterar Deepminds Sparrow-regler att chatboten svarar med svar som är avsedda att bygga en relation med användaren.

Införlivandet av Antropisk forskningsuppsättning 1 och uppsättning 2 ger den slutliga garantin att AI-konversationer förblir civila och respektfulla. AI:n är utbildad för att säkerställa att den svarar på frågor på ett genomtänkt och artigt sätt.

Sammantaget är Anthropics "Contextual AI"-modell ett otroligt viktigt genombrott inom området AI-forskning. Genom att tillåta att AI lärs ut enligt principer som härrör från så många olika källor, förbättras de etiska implikationerna av automatiserade konversationer avsevärt.

Läs mer om AI:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

Institutionell aptit växer mot Bitcoin ETFs mitt i volatilitet

Avslöjande genom 13F-anmälningar avslöjar anmärkningsvärda institutionella investerare som sysslar med Bitcoin ETF:er, vilket understryker en växande acceptans av ...

Lär dig mer

Straffdagen anländer: CZ:s öde hänger i balans när den amerikanska domstolen överväger DOJ:s vädjande

Changpeng Zhao är redo att dömas i en amerikansk domstol i Seattle i dag.

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Injective går samman med AltLayer för att ge inEVM återupptagande säkerhet
Företag Nyhetsrapport Teknologi
Injective går samman med AltLayer för att ge inEVM återupptagande säkerhet
Maj 3, 2024
Masa samarbetar med Teller för att introducera MASA Lending Pool, möjliggör USDC-lån på basen
Marknader Nyhetsrapport Teknologi
Masa samarbetar med Teller för att introducera MASA Lending Pool, möjliggör USDC-lån på basen
Maj 3, 2024
Velodrome lanserar Superchain Beta-version under de kommande veckorna och expanderar över OP Stack Layer 2 Blockchains
Marknader Nyhetsrapport Teknologi
Velodrome lanserar Superchain Beta-version under de kommande veckorna och expanderar över OP Stack Layer 2 Blockchains
Maj 3, 2024
CARV tillkännager partnerskap med Aethir för att decentralisera sitt datalager och dela ut belöningar
Företag Nyhetsrapport Teknologi
CARV tillkännager partnerskap med Aethir för att decentralisera sitt datalager och dela ut belöningar
Maj 3, 2024