21. Juni, 2023

Forskere opdager en ny måde at opdage AI-genereret tekst på

Udgivet: 21. juni 2023 kl. 1 Opdateret: 33. marts 21 kl. 2024

Redigeret og faktatjekket: 21. juni 2023 kl. 1

Kort sagt

Forskere har udviklet en metode til at detektere AI-genereret tekst ved hjælp af RoBERTa-modellen, som udtrækker indlejringer af tekst-tokens og visualiserer dem som punkter i et multidimensionelt rum.

De opdagede den tekst genereret af GPT-3.5 modeller, som f.eks ChatGPT og Davinci, havde signifikant lavere gennemsnitlige dimensioner end menneskeskreven tekst.

Forskerne skabte en robust dimensionsbaseret detektor, der var modstandsdygtig over for almindelige undvigelsesteknikker.

Detektorens nøjagtighed forblev konsekvent høj, når domæner og modeller blev ændret, med en fast tærskel og et 40 % nøjagtighedsfald, når den blev udfordret med DIPPER-teknikken.

Forskere har undersøgt området for AI-genereret tekst og udviklet en metode til at detektere indhold genereret af AI modeller som f.eks GPT , Llama. De opdagede interessant indsigt om arten af genereret tekst ved at bruge begrebet brøkdimension. Deres resultater kaster lys over de iboende forskelle mellem tekst skrevet af mennesker og tekst genereret af AI-modeller.

Forskere opdager en ny måde at opdage AI-genereret tekst på — Credit: Metaverse Post (mpost.io)

Læse: Top 100+ ord, der kan registreres af AI-detektorer

Kan dimensionen af en punktsky afledt af naturlig sprogtekst give nyttige oplysninger om dens oprindelse? Forskerne brugte RoBERTa-modellen til at udtrække indlejringer af teksttokens og visualisere dem som punkter i et multidimensionelt rum for at undersøge dette. De estimerede brøkdimensionen af disse punktskyer ved hjælp af sofistikerede teknikker inspireret af tidligere værker.

Forskerne var forbløffede over at opdage den tekst, der blev genereret af GPT-3.5 modeller, som f.eks ChatGPT og Davinci, havde signifikant lavere gennemsnitlige dimensioner end menneskeskreven tekst. Dette spændende mønster fortsatte på tværs af domæner og selv når alternative modeller som f.eks GPT-2 eller OPT blev brugt. Det er bemærkelsesværdigt, at selv når du bruger DIPPER-parafrasen, som er specielt designet til at undgå detektering, ændrede dimensionen sig kun med omkring 3%. Disse opdagelser gjorde det muligt for forskerne at skabe en robust dimensionsbaseret detektor, der er modstandsdygtig over for almindelige unddragelsesteknikker.

Navnlig forblev detektorens nøjagtighed konstant høj, når domæner og modeller blev ændret. Med en fast tærskel forblev detektionsnøjagtigheden (sand positiv rate) over 75 %, mens falsk positiv rate (FPR) forblev mindre end 1 %. Selv når detektionssystemet blev udfordret med DIPPER-teknikken, faldt nøjagtigheden til 40 %, hvilket overgik de eksisterende detektorer, inklusive dem, der er udviklet af OpenAI.

Desuden undersøgte forskerne anvendelsen af flersprogede modeller som flersproget RoBERTa. Dette gjorde det muligt for dem at udvikle lignende detektorer til andre sprog end engelsk. Mens den gennemsnitlige interne dimension af indlejringer varierede på tværs af forskellige sprog, forblev dimensionen af genererede tekster konsekvent lavere end den for menneskeskrevne tekst for hvert specifikt sprog.

Detektoren udviste dog nogle svagheder, især når den stod over for høje generationstemperaturer og primitiv generator modeller. Ved højere temperaturer kan den interne dimension af genererede tekster overgå den menneskeskrevne tekst, hvilket gør detektoren ineffektiv. Heldigvis er sådanne generatormodeller allerede detekterbare ved hjælp af alternative metoder. Derudover anerkendte forskerne, at der er plads til at udforske alternative modeller til at udtrække tekstindlejringer ud over RoBERTa.

Forskellen mellem menneskelig og AI-skrevet tekst

I januar, OpenAI annoncerede lanceringen af en ny klassifikator designet til at skelne mellem tekst skrevet af mennesker og tekst genereret af AI-systemer. Denne klassificering har til formål at løse de udfordringer, som den stigende udbredelse af AI-genereret indhold udgør, såsom misinformationskampagner og akademisk uærlighed.

Selvom det er en kompleks opgave at opdage al AI-skrevet tekst, fungerer denne klassificering som et værdifuldt værktøj til at afbøde falske påstande om menneskeligt forfatterskab i AI-genereret tekst. Gennem strenge evalueringer af et sæt engelske tekster har udviklere fundet ud af, at denne klassificering nøjagtigt identificerer 26 % af AI-skrevet tekst som "sandsynligt AI-skrevet" (sandt positive), mens den lejlighedsvis fejlmærker menneskeskreven tekst som AI-genereret (falsk) positive) med 9 %. Det er vigtigt at bemærke, at klassificererens pålidelighed forbedres, efterhånden som længden af inputteksten øges. Sammenlignet med tidligere klassifikatorer demonstrerer denne nye version markant højere pålidelighed på tekst genereret af nyere AI-systemer.

For at indsamle værdifuld feedback om nytten af uperfekte værktøjer som denne klassificering, har udviklere lavet det offentligt tilgængelige. Du kan prøve vores igangværende klassificeringsværktøj gratis. Det er dog vigtigt at forstå dens begrænsninger. Klassifikatoren skal bruges som et supplerende værktøj snarere end en primær beslutningsressource til at bestemme kilden til en tekst. Det udviser høj upålidelighed på korte tekster, og der er tilfælde, hvor menneskeskreven tekst kan være forkert mærket som AI-genereret.

Det er værd at bemærke, at meget forudsigelige tekster ikke kan identificeres konsekvent, såsom en liste over de første 1,000 primtal. Redigering af AI-genereret tekst kan også hjælpe med at undgå klassificeringen, og selvom vi kan opdatere og genoptræne klassificereren baseret på vellykkede angreb, er den langsigtede fordel ved detektion fortsat usikker. Endvidere klassificerer baseret på neurale netværk er ofte dårligt kalibreret uden for deres træningsdata, hvilket fører til ekstrem tillid til forkerte forudsigelser for input, der er væsentligt forskellige fra træningssættet.

tags:

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.

Flere artikler

Damir Yalalov