OpenAI Avslöjar sitt senaste tillvägagångssätt för att säkerställa AI-säkerhet
I korthet
OpenAI har släppt ett blogginlägg som beskriver dess förbättrade inställning till säkerhet efter den senaste tidens oro angående säkerhet och integritet och utredningar.
Företaget lovar att genomföra rigorösa tester, engagera externa experter för feedback och arbeta med regeringar för att fastställa det bästa strategi för AI-regler.
Efter att ha stått inför oro angående säkerhet och integritet och följt senare undersökningar i vissa europeiska länder, OpenAI har frigörs ett blogginlägg som beskriver företagets förbättrade inställning till säkerhet.
OpenAI lovar att genomföra rigorösa tester, engagera externa experter för feedback innan något nytt system släpps, och arbeta med regeringar för att fastställa den bästa metoden för AI-regler.
Tidigare arbetade företaget över sex månader med säkerheten och anpassningen av sin senaste modell, GPT-4, innan den släpps offentligt. För att säkerställa säkerheten för sin senaste språkmodell, GPT-4, OpenAI anlitade ett team med över 50 experter: AI-säkerhets-, etik- och policyspecialister, inklusive forskare och ingenjörer.
"Det är avgörande att vi tror att samhället måste ha tid att uppdatera och anpassa sig till allt mer kapabel AI, och att alla som påverkas av den här tekniken bör ha ett betydande inflytande över hur AI utvecklas vidare."
OpenAI skrev.
OpenAIs fokus på barns säkerhet och integritet
Italien förbjudet ChatGPT, citerar OpenAIs underlåtenhet att verifiera åldern på sina användare, trots att den är designad för individer i åldern 13 och äldre, som en av anledningarna. Ett kritiskt fokus för företagets säkerhetsinsatser har flyttats till att skydda barn genom att implementera alternativ för åldersverifiering, vilket OpenAI utforskar nu, särskilt eftersom AI-verktygen är avsedda för individer som är 18 år eller äldre eller 13 och äldre med föräldrars godkännande.
Företaget förbjuder strängt generering av hatiskt, trakasserande, våldsamt eller vuxet innehåll, och GPT-4 har redan 82 % lägre sannolikhet att svara på förfrågningar om otillåtet innehåll jämfört med GPT-3. 5.
OpenAI har etablerat ett robust system för att övervaka för missbruk och hoppas kunna göra GPT-4 tillgängliga för fler människor med tiden. Företaget samarbetar med utvecklare om skräddarsydda säkerhetsåtgärder, såsom den ideella Khan Academy, och arbetar på funktioner för att möjliggöra strängare standarder för modellutdata.
Att förbättra integriteten är en annan säkerhetsaspekt OpenAI fokuserar på, särskilt efter den senaste tiden dataöverträdelser. AI-företagets stora språkmodeller tränas på en enorm mängd text som inkluderar tillgängligt för allmänheten innehåll, licensierat innehåll och innehåll som genererats av mänskliga granskare; den använder data för att göra AI-modeller mer användbara för människor.
OpenAI vidtar åtgärder för att skydda individers integritet genom att ta bort personlig information från sin träningsdata, finjustera modeller för att avslå förfrågningar om personlig information och radera personlig information från sina system på begäran. Detta minskar chansen att AI-modeller genererar svar som inkluderar personlig information.
OpenAIs tillvägagångssätt att ta itu med AI-säkerhetsproblem är att undersöka effektiva begränsningar och anpassningstekniker och testa dem mot verkliga övergrepp. Den lovar också att vara allt mer försiktig med att skapa och distribuera mer kapabla modeller och att förbättra säkerhetsåtgärderna. Effektiv styrning av AI-utveckling och implementering är avgörande för att säkerställa säkerhet, vilket kräver teknisk och institutionell innovation.
Läs mer:
Villkor
I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.
Om författaren
Agne är en journalist som täcker de senaste trenderna och utvecklingen inom metaversen, AI och Web3 industrier för Metaverse Post. Hennes passion för berättande har lett till att hon har genomfört ett flertal intervjuer med experter inom dessa områden och alltid försökt avslöja spännande och engagerande berättelser. Agne har en kandidatexamen i litteratur och har en omfattande bakgrund i att skriva om ett brett spektrum av ämnen, inklusive resor, konst och kultur. Hon har också varit volontär som redaktör för djurrättsorganisationen, där hon hjälpt till att öka medvetenheten om djurskyddsfrågor. Kontakta henne på [e-postskyddad].
fler artiklarAgne är en journalist som täcker de senaste trenderna och utvecklingen inom metaversen, AI och Web3 industrier för Metaverse Post. Hennes passion för berättande har lett till att hon har genomfört ett flertal intervjuer med experter inom dessa områden och alltid försökt avslöja spännande och engagerande berättelser. Agne har en kandidatexamen i litteratur och har en omfattande bakgrund i att skriva om ett brett spektrum av ämnen, inklusive resor, konst och kultur. Hon har också varit volontär som redaktör för djurrättsorganisationen, där hon hjälpt till att öka medvetenheten om djurskyddsfrågor. Kontakta henne på [e-postskyddad].