Raport aktualności Technologia
10 maja 2023 r.

Eksperci ostrzegają przed „złośliwymi wstawkami” w zestawach danych AI w ChatGPT

W skrócie

ChatGPT jest potencjalnie podatne ze względu na dane treningowe.

Według naukowców za jedyne 60 USD w USA moglibyśmy zatruć 0.01% zestawów danych LAION-400 lub COYO-700 w 2022 roku.

ChatGPT technologia staje się coraz bardziej popularna, choć nowa Badania naukowe sugeruje, że ta technologia może być podatna na ataki ze względu na dane szkoleniowe, z których korzysta. Gdy modele stają się coraz bardziej złożone, a zestawy danych stają się coraz większe i bardziej złożone, złośliwi aktorzy mogą wykorzystać tę lukę do manipulowania zestawami danych i spowodować, że modele uczenia maszynowego będą generować niedokładne wyniki.

Eksperci ostrzegają przed „złośliwymi wstawkami” do zbiorów danych AI w ChatGPT
@Midjourney /TataMatalata#9861
Polecamy: Top 10 najbardziej obiecujących akcji przewidywanych przez ChatGPT (AI) osiągnąć lepsze wyniki niż wiodące światowe fundusze w 2023 r

Głównym problemem jest to, że bazy danych chatbotów są często „warunkowo zweryfikowanymi” zbiorami danych, co oznacza, że ​​istnieje pewien poziom zaufania do danych bez szczegółowej weryfikacji. Innymi słowy, te zestawy danych często mogą zawierać podstawowe problemy, które nie zostały uwzględnione. Chociaż walidacja zestawów danych często nie jest przeprowadzana ze względu na ich duży rozmiar, istnieje możliwość manipulowania tymi danymi przez złośliwe podmioty.

W rzeczywistości naukowcy zasugerowali, że do 2022 r. osoby atakujące mogą wydać około 60 USD na zatrucie 0.01% zestawów danych LAION-400 lub COYO-700. Chociaż wydaje się to niewiele, złośliwi aktorzy mogą wykorzystać te zatrute dane do własnych korzyści, jeśli nie zostaną sprawdzone. Złośliwe dane mogą ostatecznie przeciec na większe zbiory danych, psując jakość danych i prowadząc do zawodnych modeli uczenia maszynowego.

Konieczne jest podjęcie działań w celu zabezpieczenia baz danych przed złośliwymi danymi. Agregacja kilku źródeł danych powinna stać się standardem dla chatbota treningowe zbiory danych aby upewnić się, że dane są wiarygodne i dokładne. Ponadto firmy powinny eksperymentować ze zbiorami danych, aby upewnić się, że nie są one podatne na złośliwe podmioty.

Chatboty AI ze złośliwym kodem mogą być podatne na ataki hakerskie

Zagrożenie złośliwym kodem w chatbotach może być dość poważne; złośliwy kod może służyć do kradzieży danych użytkownika, umożliwienia złośliwego dostępu do serwerów i umożliwienia złośliwych działań, takich jak pranie pieniędzy lub eksfiltracja danych. Jeśli chatbot AI jest szkolony na danych ze złośliwymi wstawkami, może nieświadomie wstrzyknąć złośliwy kod do swoich odpowiedzi i nieświadomie zostać wykorzystany jako narzędzie do złośliwego zysku.

Złośliwi aktorzy mogą wykorzystać tę lukę, celowo lub nieumyślnie wprowadzając szkodliwy kod do dane treningowe. Ponadto, ponieważ chatboty AI uczą się na podstawie danych, które są im prezentowane, może to również potencjalnie doprowadzić do tego, że nauczą się nieprawidłowych odpowiedzi, a nawet złośliwego zachowania.

@Midjourney /TataMatalata#9861

Innym niebezpieczeństwem, z jakim mogą spotkać się chatboty AI, jest „nadmierne dopasowanie”. Dzieje się tak, gdy modele prognostyczne są szkolone zbyt dokładnie na danych, które otrzymały, co prowadzi do słabych prognoz, gdy są prezentowane z nowymi danymi. Może to stanowić szczególny problem, ponieważ Chatboty AI przeszkoleni w zakresie złośliwego kodu mogą potencjalnie stać się bardziej skuteczni we wprowadzaniu złośliwego kodu do swoich odpowiedzi, gdy lepiej zapoznają się z danymi.

Istotne jest, aby być świadomym zagrożeń i podjąć środki ostrożności w celu zagwarantowania danych szkoleniowych wykorzystywanych do nauczania ChatGPT jest bezpieczny i niezawodny, aby zapobiec tym potencjalnym słabościom. Początkowe dane wykorzystywane do szkolenia również muszą być oddzielne i niepowtarzalne; promocja „złośliwych wstawek” nie może kolidować ani pokrywać się z innymi źródłami. Należy to zbadać i porównać z innymi domenami, jeśli „przechwycenie” wielu potwierdzonych domen jest wykonalne w celu zweryfikowania danych.

Technologia Chatbot obiecuje zmienić sposób, w jaki ludzie prowadzą dyskusje międzyludzkie. Ale zanim będzie mógł w pełni wykorzystać swój potencjał, musi zostać ulepszony i zabezpieczony. Zbiory danych dla chatbotów muszą być dobrze sprawdzone i przygotowane do odparcia złośliwych aktorów. W ten sposób możemy mieć pewność, że w pełni wykorzystamy potencjał technologii i będziemy ją rozwijać Limity sztucznej inteligencji.

Przeczytaj więcej o sztucznej inteligencji:

Odpowiedzialność

Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.

O autorze

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Więcej artykułów
Damir Jałałow
Damir Jałałow

Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym. 

Hot Stories
Dołącz do naszego newslettera.
Najnowsze wieści

Założyciele portfela Samourai oskarżeni o ułatwianie transakcji o wartości 2 miliardów dolarów w Darknet

Zaniepokojenie założycieli Samourai Wallet stanowi wyraźną porażkę dla branży, podkreślając utrzymujące się...

Dowiedz się więcej

Szał DOGE: analiza niedawnego wzrostu wartości Dogecoina (DOGE).

Branża kryptowalut szybko się rozwija, a monety memowe przygotowują się na znaczny wzrost. Dogecoin (DOGE), ...

Dowiedz się więcej
Dołącz do naszej innowacyjnej społeczności technologicznej
Czytaj więcej
Czytaj więcej
Tydzień mody Metaverse 2024: zdecentralizowane zarządzanie i możliwości inwestycyjne w wirtualnej modzie
Sztuka Styl życia Historie i recenzje Technologia
Tydzień mody Metaverse 2024: zdecentralizowane zarządzanie i możliwości inwestycyjne w wirtualnej modzie
29 kwietnia 2024 r.
Od koncepcji do rzeczywistości: jak automatyczna konfiguracja awatara Roblox i generator tekstur przyspieszają kreatywność i innowacje
Tworzenie Historie i recenzje Technologia
Od koncepcji do rzeczywistości: jak automatyczna konfiguracja awatara Roblox i generator tekstur przyspieszają kreatywność i innowacje
29 kwietnia 2024 r.
Blok Jacka Dorseya przedstawia przełomowy system wydobywania bitcoinów z zaawansowanym chipem o grubości trzech nanometrów
Tworzenie Historie i recenzje Technologia
Blok Jacka Dorseya przedstawia przełomowy system wydobywania bitcoinów z zaawansowanym chipem o grubości trzech nanometrów
29 kwietnia 2024 r.
Friend.Tech odkłada wydanie wersji 2 na 3 maja w celu wdrożenia tokenu FRIEND Airdrop Udostępnianie dla posiadaczy „kluczy”.
rynki Raport aktualności Technologia
Friend.Tech odkłada wydanie wersji 2 na 3 maja w celu wdrożenia tokenu FRIEND Airdrop Udostępnianie dla posiadaczy „kluczy”.
29 kwietnia 2024 r.
CRYPTOMERIA LABS PTE. SP. Z O.O.