Nyhetsrapport Teknologi
Maj 10, 2023

Experter varnar för "skadliga inlägg" i AI-dataset i ChatGPT

I korthet

ChatGPT är potentiellt sårbara på grund av träningsdata.

Enligt forskare kan vi för bara 60 dollar i USA förgifta 0.01 % av LAION-400 eller COYO-700 datamängder 2022.

ChatGPT teknik blir allt mer populär, men nyligen forskning föreslår att denna teknik kan vara sårbar på grund av de träningsdata den använder. När modellerna blir mer komplexa och datamängderna blir större och mer komplexa, kan illvilliga aktörer utnyttja denna sårbarhet för att manipulera datamängderna och få maskininlärningsmodellerna att ge felaktiga resultat.

Experter varnar för "skadliga inlägg" i AI-dataset i ChatGPT
@Midjourney / TataMatalata#9861
Rekommenderas: Topp 10 mest lovande aktier förutspådde av ChatGPT (AI) för att överträffa ledande världsfonder 2023

Det primära problemet är att chatbotdatabaser ofta är "villkorligt verifierade" datamängder, vilket innebär att det finns en viss nivå av förtroende för data utan omfattande verifiering. Med andra ord kan dessa datamängder ofta ha underliggande problem som inte har beaktats. Även om validering av datauppsättningar ofta inte utförs på grund av deras stora storlek, finns det en potential för illvilliga aktörer att manipulera dessa data.

Faktum är att forskare har föreslagit att år 2022 skulle angripare kunna spendera uppskattningsvis 60 USD för att förgifta 0.01 % av LAION-400 eller COYO-700 datamängder. Även om detta inte låter som mycket, kan illvilliga aktörer använda denna förgiftade data för egen vinning om de lämnas okontrollerade. Skadliga data kan så småningom läckage in i större datamängder, korrumperar datakvaliteten och leder till opålitliga maskininlärningsmodeller.

Det är nödvändigt att vidta åtgärder för att skydda databaser mot skadlig data. Att samla flera datakällor borde bli standarden för chatbot utbildningsdatauppsättningar för att säkerställa att uppgifterna är tillförlitliga och korrekta. Dessutom bör företag experimentera med datauppsättningar för att säkerställa att de inte är sårbara för illvilliga aktörer.

AI Chatbots med skadlig kod kan vara sårbara för hackning

Hotet om skadlig kod i chatbots kan vara ganska allvarligt; skadlig kod kan användas för att stjäla användardata, möjliggöra skadlig åtkomst till servrar och möjliggöra skadliga aktiviteter som t.ex. penningtvätt eller dataexfiltrering. Om en AI-chattbot tränas på data med skadliga inlägg, kan den omedvetet injicera den skadliga koden i sina svar och omedvetet användas som ett verktyg för skadlig vinst.

Det är möjligt för illvilliga aktörer att dra fördel av denna sårbarhet genom att antingen avsiktligt eller oavsiktligt införa skadlig kod i träningsdata. Dessutom, eftersom AI-chatbotar lär sig av den data de presenteras med, kan detta också potentiellt leda till att de lär sig felaktiga svar eller till och med skadligt beteende.

@Midjourney / TataMatalata#9861

En annan fara som AI-chatbotar kan möta är "överfitting". Detta är när prediktionsmodeller tränas för noggrant på de data de gavs, vilket leder till dåliga förutsägelser när de presenteras med nya data. Detta kan vara ett särskilt problem som AI -chatbots tränade på skadlig kod kan potentiellt bli mer effektiva när det gäller att injicera skadlig kod i sina svar när de blir mer bekanta med data.

Det är viktigt att vara medveten om riskerna och vidta försiktighetsåtgärder för att garantera utbildningsdata som används för att undervisa ChatGPT är säker och pålitlig för att förhindra dessa potentiella svagheter. De initiala data som används för träning måste också hållas separata och unika; främjandet av "skadliga inlägg" får inte komma i konflikt med eller överlappa andra källor. Det bör undersökas och jämföras med andra domäner om det är möjligt att "fånga" flera bekräftade domäner för att validera data.

Chatbot-tekniken lovar att förändra hur människor för mänskliga diskussioner. Men innan den kan förverkliga sin fulla potential måste den förbättras och värnas. Datauppsättningar för chatbots måste vara väl kontrollerade och redo för att avvärja skadliga aktörer. Genom att göra detta kan vi säkerställa att vi fullt ut utnyttjar teknikens potential och fortsätter att driva på gränser av artificiell intelligens.

Läs mer om AI:

Villkor

I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.

Om författaren

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

fler artiklar
Damir Yalalov
Damir Yalalov

Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet. 

Samourai Wallet-grundare anklagade för att underlätta $2 miljarder i Darknet-erbjudanden

Uppfattningen av Samourai Wallet-grundarna representerar ett anmärkningsvärt bakslag för branschen, vilket understryker den ihållande ...

Lär dig mer

DOGE Frenzy: Analysera Dogecoins (DOGE) senaste ökning i värde

Kryptovalutaindustrin expanderar snabbt, och meme-mynt förbereder sig för en betydande uppgång. Dogecoin (DOGE), ...

Lär dig mer
Gå med i vår innovativa teknikgemenskap
Läs mer
Läs mer
Metaverse Fashion Week 2024: Decentraliserad styrning och investeringsmöjligheter i virtuellt mode
Konst Livsstil Berättelser och recensioner Teknologi
Metaverse Fashion Week 2024: Decentraliserad styrning och investeringsmöjligheter i virtuellt mode
29 april 2024
Från koncept till verklighet: Hur Robloxs Avatar Auto Setup och Texture Generator accelererar kreativitet och innovation
Mjukvara Berättelser och recensioner Teknologi
Från koncept till verklighet: Hur Robloxs Avatar Auto Setup och Texture Generator accelererar kreativitet och innovation
29 april 2024
Jack Dorsey's Block avslöjar banbrytande Bitcoin-gruvsystem med avancerad tre-nanometerschip
Mjukvara Berättelser och recensioner Teknologi
Jack Dorsey's Block avslöjar banbrytande Bitcoin-gruvsystem med avancerad tre-nanometerschip
29 april 2024
Friend.Tech skjuter upp V2-släppet till 3 maj för att implementera FRIEND-token Airdrop Delning för "nyckel"-innehavare
Marknader Nyhetsrapport Teknologi
Friend.Tech skjuter upp V2-släppet till 3 maj för att implementera FRIEND-token Airdrop Delning för "nyckel"-innehavare
29 april 2024