Anthropic föreslår en "kontextuell AI" för chattmodeller baserat på 60 principer
I korthet
OpenAI använder förstärkningsinlärning från mänsklig feedback (RLHF) för att anpassa språkmodeller med mänskliga principer, säkerhet och användbarhet.
Anthropic föreslog ett alternativt tillvägagångssätt: kontextuell AI, som innebär att människor skriver en konstitution som modellen bör följa.
Denna konstitution är baserad på FN:s deklaration om mänskliga rättigheter, Apples användarvillkor, principer som uppmuntrar hänsyn till icke-västerländska perspektiv.
Anthropic har föreslagit ett nytt tillvägagångssätt för att träna chattmodeller med hjälp av 'Konstitutionell AI'. Denna metod bygger på OpenAIÄr förstärkning lärande från mänsklig feedback men bygger vidare på den genom att undvika behovet av att skriva djupa träningsprov. Istället är modellen tränad att svara på input genom att använda en konstitution som är tänkt att fungera som en uppsättning lagar för modellen att följa.
Rekommenderas: ex-OpenAI anställda grundade Anthropic, ett företag som har fått över 700 miljoner dollar i finansiering |
Genom denna metod kan AI generera sina egna träningsprov genom att utvärdera vad den har sagt kontra dess uppsättning juridiskt accepterade principer. Denna tidsbesparande teknik kan ses som Isaac Asimov's Robotics Laws sätta i verket.
Principerna som ligger till grund för modellen är för många för att diskutera i detalj. Men de täcker många ämnen, såsom moral, riskaversion, ekonomi och artificiell intelligens. Var och en har utvecklats för att hjälpa till att styra AI:s beslut när det gäller att svara på samtalsuppmaningar.
Anthropic har lyckats effektivt träna en AI-modell vid namn Claude, som framgångsrikt konkurrerar med OpenAIÄr ChatGPT. Använda Konstitution-AI-metodenClaude kunde svara på samtalsuppmaningar med en imponerande noggrannhetsnivå, men ytterligare förbättringar förväntas när Anthropic fortsätter att bygga på denna spelförändrande teknologi.
Detta nya tillvägagångssätt har faktiskt potential att spara tid och pengar för företag som inte längre behöver konstruera sina egna utbildningsexemplar. Snarare kan denna "färdiga" metod användas som grund för att skapa skräddarsydda modeller - inga programmeringskunskaper krävs. Det är också viktigt att notera hur denna teknik också lovar att öka säkerheten när det kommer till konversationsbotar. Skapa en uppsättning juridiskt accepterade principer minskar risken av AI:n blir skurk.
Därför lovar Constituation AI inte bara att göra utvecklingen av chattmodeller enklare och snabbare, utan det kommer också att göra det säkrare. En win-win-situation för både artificiell intelligens och ChatBots.
En analytisk titt på Anthropics "Contextual AI" för chatbots
Anthropics Contextual AI är baserad på att införliva mer än 60 principer härledda från FN:s deklaration om mänskliga rättigheter, Apples användarvillkor, principer som uppmuntrar hänsyn till icke-västerländska perspektiv, Deepminds Sparrow Rules och antropisk forskningsuppsättning 1 och uppsättning 2.
Det faktum att AI nu kan läras att bete sig enligt principer som härrör från ett så omfattande och mångsidigt utbud av källor är verkligen anmärkningsvärt. Genom att införliva principer från FN:s deklaration om mänskliga rättigheter, till exempel, återspeglar chatbot-svar nu vikten av att bevara föreställningen om frihet, jämlikhet och broderskap. Sådana principer är en viktig komponent för att säkerställa detta chatbot-konversationer förbli etisk och respektfull. På samma sätt säkerställer införlivandet av Apples användarvillkor chatbot tar hänsyn till användarnas integritetsintressen.
Principer som uppmuntrar övervägande av icke-västerländska perspektiv spelar också en viktig roll i den "kontextuella AI"-modellen. Dessa principer återspeglar behovet av AI att respektera andra kulturer och säkerställa att chatbot-svar inte uppfattas som skadliga eller stötande. På liknande sätt dikterar Deepminds Sparrow-regler att chatboten svarar med svar som är avsedda att bygga en relation med användaren.
Införlivandet av Antropisk forskningsuppsättning 1 och uppsättning 2 ger den slutliga garantin att AI-konversationer förblir civila och respektfulla. AI:n är utbildad för att säkerställa att den svarar på frågor på ett genomtänkt och artigt sätt.
Sammantaget är Anthropics "Contextual AI"-modell ett otroligt viktigt genombrott inom området AI-forskning. Genom att tillåta att AI lärs ut enligt principer som härrör från så många olika källor, förbättras de etiska implikationerna av automatiserade konversationer avsevärt.
Läs mer om AI:
Villkor
I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.
Om författaren
Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.
fler artiklarDamir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.