AI kan berätta exakt vem du är, även om du inte berättar för dem
Även i situationer där människor tror att de inte har avslöjat något personligt, visar AI-språkmodeller en oväntad nivå av skicklighet i att förstå användarinformation. Detta fenomen förklaras av en ny studie genomförs av Federal Institute of Technology i Zürich. Baserat på sneda ledtrådar indikerar forskningen att neurala nätverk kan skapa anmärkningsvärt exakta användarprofiler.
Forskarna använde ett Reddit-inlägg som var tillgängligt för allmänheten som exempel för sin undersökning. Användaren rapporterade att han fastnade i trafiken när han försökte en svår kroksväng. Baserat på dessa till synes omärkliga detaljer drog språkmodellen slutsatsen att användaren med största sannolikhet bor i Melbourne, Australien, en stad där den här typen av handlingar är typiska.
Forskare skapade en datauppsättning med riktiga Reddit-profiler och fann den aktuella LLM kan exakt härleda olika personliga egenskaper, såsom plats, inkomst och kön. Dessa modeller uppnådde upp till 85 % noggrannhet för topp-1 slutledning och 95.8 % noggrannhet för topp-3 slutledning, allt till en betydligt lägre kostnad (100 gånger) och på kortare tid (240 gånger) jämfört med mänskliga ansträngningar.
I ett annat exempel delar en användare att de, eftersom de är singlar, har en udda födelsedagsvana att bli täckt av kanel. Här uppskattade språkmodellen författarens ålder till cirka 25. Hon bor i Danmark där det är brukligt att strö kanel på ensamstående 25-åringar.
Flera språkmodeller, inklusive de från Google, Meta, OpenAI, och Anthropic, testades i studien. Anmärkningsvärt, GPT-4 visade den högsta nivån av expertis och kände korrekt igen användarnas personliga information i nästan 85 % av fallen. Implikationerna av sådana förmågor ifrågasätts allvarligt av denna uppenbarelse.
Forskare undersökte vanliga integritetsskydd som textanonymisering och modellanpassning och fann att de för närvarande är ineffektiva när det gäller att skydda användares integritet mot LLM slutledning. Studien understryker att nuvarande LLM:er har förmågan att härleda personlig information i en aldrig tidigare skådad skala. I avsaknad av effektiva försvar betonar forskare behovet av en bredare diskussion om LLM:s integritetskonsekvenser, som sträcker sig bortom oron för memorering och strävar efter mer omfattande integritetsskyddsåtgärder.
Även om dessa språkmodeller blir bättre på att tolka indirekta ledtrådar tror forskare att de på grund av den stora mängden träningsdata de använder kan vara extremt användbara verktyg för marknadsförare eller till och med dåliga aktörer.
- Nyligen, Deloittes undersökning av över 1,700 22 yrkesverksamma avslöjar en växande klyfta mellan det snabba införandet av generativ AI och den eftersläpande utvecklingen av etiska principer. Datasekretess är den främsta etiska oro, med 39 % av de tillfrågade anger det som sin främsta oro. Trots detta tror XNUMX % av de tillfrågade att kognitiva teknologier har störst potential för samhällsnytta. Undersökningen visar också en förändring i förväntningarna mot statligt engagemang i att sätta etiska tekniska standarder.
- Dessutom, Snapchats moderbolag, Snap, är under granskning för integritetsrisker relaterad till dess AI-chatbot, 'My AI'. Storbritanniens informationskommissionärs kontor (ICO) har utfärdat ett preliminärt verkställighetsmeddelande, vilket potentiellt påverkar Snaps databehandlingsaktiviteter. ICO hävdar att Snap misslyckades med att bedöma integritetskonsekvenserna för användare, särskilt barn.
Villkor
I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.
Om författaren
Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.
fler artiklarDamir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.