Võib 10 2023

Eksperdid hoiatavad tehisintellekti andmekogumitesse tehtavate pahatahtlike sisestuste eest ChatGPT

by Damir Jalalov

Avaldatud: 10. mai 2023 kell 5:09 Värskendatud: 10. mai 2023 kell 5:09

by Karolina Gaszcz

Muudetud ja faktide alusel kontrollitud: 10. mai 2023 kell 5:09

Põgusalt

ChatGPT on potentsiaalselt haavatav treeningandmete tõttu.

Teadlaste sõnul võime 60. aastal USA-s vaid 0.01 dollari eest mürgitada 400% LAION-700 või COYO-2022 andmekogumitest.

ChatGPT tehnoloogia on muutumas üha populaarsemaks, kuid hiljutiseks teadustöö viitab sellele, et see tehnoloogia võib selle kasutatavate treeningandmete tõttu olla haavatav. Kuna mudelid muutuvad keerukamaks ja andmekogumid muutuvad üha keerukamaks, võivad pahatahtlikud toimijad seda haavatavust ära kasutada, et andmekogumitega manipuleerida ja põhjustada masinõppemudelite ebatäpseid tulemusi.

Eksperdid hoiatavad tehisintellekti andmekogumitesse tehtavate pahatahtlike sisestuste eest ChatGPT — @Midjourney / TataMatalata#9861

Soovitan: Ennustanud 10 kõige lootustandvamat aktsiat ChatGPT (AI) ületama 2023. aastal maailma juhtivaid fonde

Peamine murekoht on see, et vestlusrobotite andmebaasid on sageli "tingimisi kontrollitud" andmekogumid, mis tähendab, et andmetesse on usaldatud teatud tase ilma ulatusliku kontrollimiseta. Teisisõnu, nendel andmekogumitel võib sageli olla probleeme, mida pole arvesse võetud. Kuigi andmekogumeid nende suure suuruse tõttu sageli ei valideerita, võivad pahatahtlikud osalised neid andmeid manipuleerida.

Tegelikult on teadlased väitnud, et 2022. aastaks võivad ründajad kulutada hinnanguliselt 60 dollarit, et mürgitada 0.01% LAION-400 või COYO-700 andmekogumitest. Kuigi see ei kõla palju, võivad pahatahtlikud osalejad neid mürgitatud andmeid oma huvides kasutada, kui neid ei kontrollita. Pahatahtlikud andmed võivad lõpuks lekkima suuremateks andmekogumiteks, rikkudes andmete kvaliteeti ja põhjustades ebausaldusväärseid masinõppe mudeleid.

Andmebaaside kaitsmiseks pahatahtlike andmete eest on vaja astuda samme. Mitme andmeallika koondamine peaks saama vestlusroboti standardiks koolituse andmestikud et andmed oleksid usaldusväärsed ja täpsed. Lisaks peaksid ettevõtted katsetama andmekogumitega, et tagada, et need pole pahatahtlike osalejate suhtes haavatavad.

Pahatahtliku koodiga AI-vestlusbotid võivad olla häkkimise suhtes haavatavad

Pahatahtliku koodi oht vestlusrobotites võib olla üsna tõsine; pahatahtlikku koodi saab kasutada kasutajaandmete varastamiseks, pahatahtliku juurdepääsu võimaldamiseks serveritele ja pahatahtlike tegevuste, näiteks rahapesu või andmete väljafiltreerimine. Kui AI-vestlusbot on õpetatud kasutama pahatahtlikke sisestusi sisaldavaid andmeid, võib see pahatahtliku koodi oma vastustesse teadmatult sisestada ja seda teadmatult kasutada pahatahtliku kasu saamiseks.

Pahatahtlikud osalejad võivad seda haavatavust ära kasutada, sisestades kas tahtlikult või tahtmatult pahatahtlikku koodi koolituse andmed. Lisaks, kuna tehisintellekti vestlusrobotid õpivad neile esitatud andmetest, võib see viia ka selleni, et nad õpivad valesid vastuseid või isegi pahatahtlikku käitumist.

Teine oht, millega AI-vestlusbotid võivad kokku puutuda, on "ülepaigutamine". See on siis, kui ennustusmudeleid koolitatakse liiga täpselt neile antud andmete põhjal, mis põhjustab uute andmete esitamisel kehvad prognoosid. See võib olla eriline probleem, kuna AI vestlusrobotid Pahatahtliku koodiga koolitatud kasutajad võivad andmetega paremini tutvudes muutuda tõhusamaks pahatahtliku koodi sisestamisel nende vastustesse.

Oluline on olla teadlik riskidest ja võtta ettevaatusabinõusid, et tagada õpetamisel kasutatavad koolitusandmed ChatGPT on nende võimalike nõrkuste vältimiseks turvaline ja usaldusväärne. Samuti tuleb hoida eraldi ja unikaalseid koolitusel kasutatavaid lähteandmeid; "pahatahtlike lisade" reklaamimine ei tohi olla vastuolus teiste allikatega ega kattuda nendega. Seda tuleks uurida ja võrrelda teiste domeenidega, kas andmete kinnitamiseks on võimalik mitme kinnitatud domeeni "püüdmine".

Chatboti tehnoloogia lubab muuta inimeste vestlusi. Kuid enne oma täieliku potentsiaali realiseerimist tuleb seda täiustada ja kaitsta. Vestlusrobotite andmekogud peavad olema hästi kontrollitud ja pahatahtlike osalejate tõrjumiseks valmis. Seda tehes saame tagada, et kasutame täielikult ära tehnoloogia potentsiaali ja jätkame selle edasiarendamist piirid tehisintellektist.

Loe AI kohta lähemalt:

Sildid:

Kaebused

Vastavalt Usaldusprojekti juhised, pange tähele, et sellel lehel esitatud teave ei ole mõeldud ega tohiks tõlgendada kui juriidilist, maksu-, investeerimis-, finants- või muud nõuannet. Oluline on investeerida ainult seda, mida saate endale lubada kaotada, ja kahtluste korral küsida sõltumatut finantsnõu. Lisateabe saamiseks soovitame vaadata nõudeid ja tingimusi ning väljaandja või reklaamija pakutavaid abi- ja tugilehti. MetaversePost on pühendunud täpsele ja erapooletule aruandlusele, kuid turutingimusi võidakse ette teatamata muuta.

Umbes Autor

Damir on ettevõtte meeskonnajuht, tootejuht ja toimetaja Metaverse Post, mis hõlmab selliseid teemasid nagu AI/ML, AGI, LLM-id, Metaverse ja Web3-seotud väljad. Tema artiklid meelitavad igal kuul tohutut vaatajaskonda, üle miljoni kasutaja. Ta näib olevat ekspert, kellel on 10-aastane SEO ja digitaalse turunduse kogemus. Damirit on mainitud ajakirjades Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto ja muud väljaanded. Ta reisib digitaalse nomaadina AÜE, Türgi, Venemaa ja SRÜ vahel. Damir omandas bakalaureusekraadi füüsikas, mis on tema arvates andnud talle kriitilise mõtlemise oskused, mida on vaja pidevalt muutuval Interneti-maastikul edukaks saamiseks.

Veel artikleid

Damir Jalalov