Billedgenererende AI-modeller bliver trænet på eksplicitte børnebilleder, hævder Stanford
Kort sagt
Populære tekst-til-billede generative AI-værktøjer inklusive Stable Diffusion, bliver trænet i tusindvis af billeder af seksuelt misbrug af børn.
Populær tekst-til-billede generativ AI værktøjer, herunder Stable Diffusion fra Stability AI bliver trænet i tusindvis af billeder af seksuelt misbrug af børn, ifølge forskningsrapporten fra Stanford Internet Observatory.
Rapporten tilføjede, at disse billeder letter genereringen af realistisk eksplicit indhold, der involverer falske børn, og transformationen af påklædte teenagere til nøgenbilleder, og opfordrer til øjeblikkelig handling fra virksomhederne bag sådanne værktøjer.
Stanford Internet Observatorys undersøgelse fokuserede på LAION database, et massivt lager af onlinebilleder og billedtekster brugt af førende AI billedskabere ligesom Stable Diffusion, for at træne AI-modeller.
Før de kontrollerede billedgenererende AI-værktøjer, var forskere af den opfattelse, at AI-værktøjerne producerede misbrugsbilleder af børn ved at kombinere information fra voksenpornografi og godartede billeder af børn. Observatoriets resultater præsenterer imidlertid en foruroligende drejning, med over 3,200 billeder af formodet seksuelt misbrug af børn identificeret i LAION-datasættet.
Mens LAION hurtigt reagerede på rapporten ved midlertidigt at fjerne dens datasæt, er implikationerne af disse billeder vidtrækkende. Selvom de udgør en brøkdel af LAIONs enorme indeks på 5.8 milliarder billeder, hævder Stanford-gruppen, at de sandsynligvis påvirker evnen til AI værktøjer at generere skadelige output.
En væsentlig spiller i LAION-databasens udvikling er Stability AI, en London-baseret startup, der er ansvarlig for at forme datasættet. Rapporten fremhæver, at en ældre version af deres Stable Diffusion model, der blev introduceret sidste år, er stadig til stede i forskellige applikationer, som den primære kilde til at generere eksplicitte billeder.
Skønt Stability AI hævder kun at være vært for filtrerede versioner og har taget skridt til at afbøde misbrug, ligger udfordringen i den ældre models udbredelse.
Generativ AI-implementering kræver streng validering
Kernen i problemet sporer tilbage til den hurtige implementering af mange generative AI-projekter på markedet, ifølge David Thiel, chefteknolog ved Stanford Internet Observatory.
Thiel påpeger, at disse projekter ofte blev gjort bredt tilgængelige på grund af intens konkurrence på området, uden den nødvendige strenge opmærksomhed i udviklingsfasen.
Stanford-forskere slår til lyd for drastiske foranstaltninger for at løse problemet effektivt. Anbefalinger omfatter sletning eller rengøring af træningssæt afledt af LAION-5B og fremstilling af en ældre version af Stable Diffusion mindre tilgængelig.
Kompleksiteten i at rydde op i data med tilbagevirkende kraft udgør imidlertid en betydelig udfordring, hvilket foranlediger en opfordring til samarbejde med børnesikkerhedseksperter under udviklingen af AI databaser.
Da skoler og retshåndhævende myndigheder verden over udtrykker bekymring over de potentielle konsekvenser af disse fund, er fokus nu på AI industri for hurtigst muligt at adressere og rette op på de skadelige fejl i deres teknologi.
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Kumar er en erfaren teknisk journalist med speciale i de dynamiske skæringspunkter mellem AI/ML, marketingteknologi og nye områder som krypto, blockchain og NFTs. Med over 3 års erfaring i branchen har Kumar etableret en dokumenteret track record i at skabe overbevisende fortællinger, udføre indsigtsfulde interviews og levere omfattende indsigt. Kumars ekspertise ligger i at producere indhold med stor gennemslagskraft, herunder artikler, rapporter og forskningspublikationer til fremtrædende industriplatforme. Med et unikt færdighedssæt, der kombinerer teknisk viden og historiefortælling, udmærker Kumar sig ved at kommunikere komplekse teknologiske koncepter til forskellige målgrupper på en klar og engagerende måde.
Flere artiklerKumar er en erfaren teknisk journalist med speciale i de dynamiske skæringspunkter mellem AI/ML, marketingteknologi og nye områder som krypto, blockchain og NFTs. Med over 3 års erfaring i branchen har Kumar etableret en dokumenteret track record i at skabe overbevisende fortællinger, udføre indsigtsfulde interviews og levere omfattende indsigt. Kumars ekspertise ligger i at producere indhold med stor gennemslagskraft, herunder artikler, rapporter og forskningspublikationer til fremtrædende industriplatforme. Med et unikt færdighedssæt, der kombinerer teknisk viden og historiefortælling, udmærker Kumar sig ved at kommunikere komplekse teknologiske koncepter til forskellige målgrupper på en klar og engagerende måde.