Ulat sa Balita Teknolohiya
Mayo 10, 2023

Nag-iingat ang Mga Eksperto Laban sa 'Malicious Insert' sa AI Datasets in ChatGPT

Sa madaling sabi

ChatGPT ay potensyal mahina dahil sa data ng pagsasanay.

Ayon sa mga mananaliksik, sa halagang $60 lang sa US, maaari naming lasonin ang 0.01% ng LAION-400 o COYO-700 set ng data sa 2022.

ChatGPT ang teknolohiya ay lalong nagiging popular, ngunit kamakailan lamang pananaliksik nagmumungkahi na ang teknolohiyang ito ay maaaring mahina dahil sa data ng pagsasanay na ginagamit nito. Habang nagiging mas kumplikado ang mga modelo at nagiging mas malaki at mas kumplikado ang mga set ng data, maaaring samantalahin ng mga nakakahamak na aktor ang kahinaang ito upang manipulahin ang mga set ng data at maging sanhi ng mga hindi tumpak na resulta ang mga modelo ng machine learning.

Nag-iingat ang Mga Eksperto Laban sa 'Malicious Insert' sa AI Datasets in ChatGPT
@Midjourney / TataMatalata#9861
Inirerekomenda: Nangungunang 10 Pinaka-Promising na Stocks na Hinulaan ni ChatGPT (AI) na Outperform Nangungunang World Funds sa 2023

Ang pangunahing alalahanin ay ang mga database ng chatbot ay madalas na mga set ng data na "na-verify na may kondisyon," ibig sabihin ay mayroong isang tiyak na antas ng tiwala na inilalagay sa data nang walang malawak na pag-verify. Sa madaling salita, ang mga dataset na ito ay kadalasang may mga pinagbabatayan na isyu na hindi pa napag-isipan. Bagama't kadalasang hindi ginagawa ang pagpapatunay ng mga dataset dahil sa malaking sukat ng mga ito, may potensyal na manipulahin ng mga malisyosong aktor ang data na ito.

Sa katunayan, iminungkahi ng mga mananaliksik na sa 2022, ang mga umaatake ay maaaring gumastos ng tinatayang $60 upang lason ang 0.01% ng mga set ng data ng LAION-400 o COYO-700. Bagama't hindi ito gaanong katunog, maaaring gamitin ng mga malisyosong aktor ang nalason na data na ito para sa kanilang sariling pakinabang kung hindi masusuri. Ang malisyosong data ay maaaring sa kalaunan mahayag sa mas malalaking dataset, sinisira ang kalidad ng data at humahantong sa hindi mapagkakatiwalaang mga modelo ng machine-learning.

Kinakailangang gumawa ng mga hakbang upang pangalagaan ang mga database laban sa malisyosong data. Ang pagsasama-sama ng ilang data source ay dapat na maging pamantayan para sa chatbot mga dataset ng pagsasanay upang matiyak na ang data ay maaasahan at tumpak. Bukod pa rito, dapat mag-eksperimento ang mga kumpanya sa mga dataset upang matiyak na hindi sila masusugatan sa mga malisyosong aktor.

Ang AI Chatbots na may Malicious Code ay Maaaring Masugatan sa Pag-hack

Ang banta ng malisyosong code sa mga chatbot ay maaaring maging seryoso; malisyosong code ay maaaring gamitin upang magnakaw ng data ng user, paganahin ang malisyosong pag-access sa mga server, at paganahin ang mga malisyosong aktibidad tulad ng money laundering o data exfiltration. Kung ang isang AI chatbot ay sinanay sa data na may mga nakakahamak na pagsingit, maaari nitong hindi sinasadyang maipasok ang malisyosong code sa mga tugon nito at hindi alam na magamit bilang isang tool para sa malisyosong pakinabang.

Posible para sa mga malisyosong aktor na samantalahin ang kahinaang ito sa pamamagitan ng alinman sa sinasadya o hindi sinasadyang pagpapasok ng malisyosong code sa data ng pagsasanay. Bilang karagdagan, dahil natututo ang AI chatbots mula sa data na ipinakita dito, maaari rin itong humantong sa pag-aaral nila ng mga maling tugon o kahit na malisyosong pag-uugali.

@Midjourney / TataMatalata#9861

Ang isa pang panganib na maaaring harapin ng AI chatbots ay ang "overfitting." Ito ay kapag ang mga modelo ng hula ay sinanay ng masyadong malapit sa data na ibinigay sa kanila, kaya humahantong sa mga mahihirap na hula kapag ipinakita ng bagong data. Ito ay maaaring isang partikular na problema bilang AI chatbots ang sinanay sa malisyosong code ay maaaring maging mas epektibo sa pag-iniksyon ng malisyosong code sa kanilang mga tugon habang nagiging mas pamilyar sila sa data.

Mahalagang magkaroon ng kamalayan sa mga panganib at magsagawa ng mga pag-iingat upang magarantiya ang data ng pagsasanay na ginagamit sa pagtuturo ChatGPT ay ligtas at maaasahan upang maiwasan ang mga potensyal na kahinaan na ito. Ang paunang data na ginamit para sa pagsasanay ay dapat ding panatilihing hiwalay at kakaiba; ang pag-promote ng "mga malisyosong pagsingit" ay hindi dapat sumalungat sa o magkakapatong sa iba pang mga mapagkukunan. Dapat itong suriin at ihambing sa iba pang mga domain kung ang "pagkuha" ng maraming kumpirmadong domain ay magagawa upang ma-validate ang data.

Nangangako ang teknolohiya ng Chatbot na babaguhin kung paano isinasagawa ng mga tao ang mga talakayan ng tao. Ngunit bago nito matanto ang buong potensyal nito, kailangan itong pagbutihin at pangalagaan. Ang mga dataset para sa mga chatbot ay kailangang suriing mabuti at ihanda upang maitaboy ang mga malisyosong aktor. Sa paggawa nito, masisiguro nating lubos nating magagamit ang potensyal ng teknolohiya at patuloy na itinutulak ang mga limitasyon ng artipisyal na katalinuhan.

Magbasa pa tungkol sa AI:

Pagtanggi sa pananagutan

Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.

Tungkol sa Ang May-akda

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Mas marami pang artikulo
Damir Yalalov
Damir Yalalov

Si Damir ang pinuno ng pangkat, tagapamahala ng produkto, at editor sa Metaverse Post, sumasaklaw sa mga paksa gaya ng AI/ML, AGI, LLMs, Metaverse, at Web3-mga kaugnay na larangan. Ang kanyang mga artikulo ay umaakit ng napakalaking madla na mahigit sa isang milyong user bawat buwan. Mukhang isa siyang eksperto na may 10 taong karanasan sa SEO at digital marketing. Nabanggit si Damir sa Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto, at iba pang publikasyon. Naglalakbay siya sa pagitan ng UAE, Turkey, Russia, at ng CIS bilang digital nomad. Nakamit ni Damir ang bachelor's degree sa physics, na pinaniniwalaan niyang nagbigay sa kanya ng mga kritikal na kasanayan sa pag-iisip na kailangan para maging matagumpay sa pabago-bagong tanawin ng internet. 

Ang Mga Tagapagtatag ng Samourai Wallet ay Inakusahan na Nagpapadali ng $2B sa Darknet Deals

Ang pangamba ng mga tagapagtatag ng Samourai Wallet ay kumakatawan sa isang kapansin-pansing pag-urong para sa industriya, na binibigyang-diin ang patuloy na ...

Malaman Higit Pa

The DOGE Frenzy: Pagsusuri sa Kamakailang Pagtaas ng Halaga ng Dogecoin (DOGE).

Ang industriya ng cryptocurrency ay mabilis na lumalawak, at ang mga meme coins ay naghahanda para sa isang makabuluhang pagtaas. Dogecoin (DOGE), ...

Malaman Higit Pa
Sumali sa Aming Innovative Tech Community
Magbasa Pa
Magbasa nang higit pa
Metaverse Fashion Week 2024: Desentralisadong Pamamahala at Mga Oportunidad sa Pamumuhunan sa Virtual Fashion
Sining Pamumuhay Mga Kuwento at Pagsusuri Teknolohiya
Metaverse Fashion Week 2024: Desentralisadong Pamamahala at Mga Oportunidad sa Pamumuhunan sa Virtual Fashion
Abril 29, 2024
Mula sa Konsepto hanggang sa Realidad: Paano Pinapabilis ng Avatar Auto Setup at Texture Generator ng Roblox ang Pagkamalikhain at Pagbabago
software Mga Kuwento at Pagsusuri Teknolohiya
Mula sa Konsepto hanggang sa Realidad: Paano Pinapabilis ng Avatar Auto Setup at Texture Generator ng Roblox ang Pagkamalikhain at Pagbabago
Abril 29, 2024
Inilabas ng Block ni Jack Dorsey ang Groundbreaking Bitcoin Mining System na may Advanced na Three-Nanometer Chip
software Mga Kuwento at Pagsusuri Teknolohiya
Inilabas ng Block ni Jack Dorsey ang Groundbreaking Bitcoin Mining System na may Advanced na Three-Nanometer Chip
Abril 29, 2024
Ipinagpaliban ng Friend.Tech ang V2 Release Sa Mayo 3 Para Ipatupad ang FRIEND Token Airdrop Pagbabahagi Para sa Mga May Hawak ng 'Susi'
markets Ulat sa Balita Teknolohiya
Ipinagpaliban ng Friend.Tech ang V2 Release Sa Mayo 3 Para Ipatupad ang FRIEND Token Airdrop Pagbabahagi Para sa Mga May Hawak ng 'Susi'
Abril 29, 2024
CRYPTOMERIA LABS PTE. LTD.