November 06, 2023

Let-til-hård generalisering

Udgivet: 06. november 2023 kl. 3 Opdateret: 45. november 06 kl. 2023

Hvad er let-til-hård generalisering?

Let-til-hård generalisering refererer til processen med at evaluere algoritmernes ydeevne på opgaver, der varierer i kompleksitet, fra enkle og håndterbare til mere udfordrende. I forbindelse med AI-udvikling hjælper denne tilgang med at sikre, at modeller ikke kun er effektive til at håndtere ligetil opgaver, men også i stand til at skalere deres adfærd, når de står over for mere komplekse udfordringer.

Forstå let-til-hård generalisering

Overvej for eksempel scenariet, hvor en model testes med henblik på at identificere fejl i et lille stykke kode.

I maskinlæring kan let-til-hård generalisering f.eks. involvere træning af en model på et datasæt, der starter med enkle eller godt adskilte eksempler og gradvist introducerer mere komplekse eller overlappende eksempler. Denne tilgang har til formål at forbedre modellens evne til at håndtere udfordrende scenarier og forbedre dens overordnede ydeevne på usete data.

I perceptuel læring kan let-til-hård generalisering involvere træning af individer i perceptuelle opgaver, der starter med let skelnelige stimuli og gradvist introducerer sværere eller tvetydige stimuli. Denne proces hjælper individer med at udvikle bedre diskriminationsevner og generalisere deres læring til en bredere vifte af stimuli.

Overordnet set er let-til-hård generalisering en strategi, der bruges til at forbedre læring, forbedre præstationer og fremme bedre generaliseringsevner ved gradvist at øge sværhedsgraden eller kompleksiteten af eksempler eller opgaver.

Seneste nyt vedr Let-til-hård generalisering

Forskere fra University College London har introduceret Spawrious-datasættet, en billedklassificering benchmark suite, for at adressere falske sammenhænge i AI-modeller. Datasættet, der består af 152,000 billeder af høj kvalitet, omfatter både en-til-en og mange-til-mange falske korrelationer. Holdet fandt ud af, at datasættet viste en utrolig ydeevne og afslørede svaghederne ved de nuværende modeller på grund af deres afhængighed af fiktive baggrunde. Datasættet fremhævede også behovet for at fange de indviklede relationer og indbyrdes afhængigheder i M2M falske korrelationer.
Den nye AI, kendt som en Differential Neural Computer (DNC), er afhængig af en ekstern hukommelsesenhed med høj kapacitet til at gemme tidligere lærte modeller og generere nye neurale netværk baseret på arkiverede modeller. Denne nye form for generaliseret læring kunne bane vejen for en æra med kunstig intelligens, der vil belaste den menneskelige fantasi.
Et nyligt papir fra MIT fandt det GPT-4, en sprogmodel (LLM), der scorede 100 % på MIT's pensum, havde ufuldstændige spørgsmål og skæve evalueringsmetoder, hvilket resulterede i væsentligt lavere nøjagtighed. Allen Institute for AI's "Faith and Fate: Limits of Transformers on Compositionality" diskuterer begrænsningerne ved transformer-baserede modeller med fokus på kompositionsproblemer, der kræver flertrins-ræsonnement. Undersøgelsen viste, at transformatormodeller viser et fald i ydeevne, efterhånden som opgavekompleksiteten øges, og finjustering med opgavespecifikke data forbedrer ydeevnen inden for det trænede domæne, men ikke generalisere til usete eksempler. Forfatterne foreslår, at transformatorer bør udskiftes på grund af deres begrænsninger i at udføre komplekse kompositoriske ræsonnementer, afhængighed af mønstre, memorisering og enkelttrinsoperationer.

Mindst-til-mest tilskyndelse er blevet foreslået for at løse længde-generalisering, eller mere generelt, kompositorisk generalisering og let-til-hård generalisering. For simple problemer som paritet kan mindst-til-mest prompt løse det næsten perfekt.https://t.co/hq7gA1ulay https://t.co/vijJ3kt1Ob pic.twitter.com/Uw9mKkFK7l
— Denny Zhou (@denny_zhou) Juli 15, 2022

Vi bruger kerneentropi af indlejringer til at opnå SOTA i usikkerhedsestimat af naturlig sproggenerering (https://t.co/VwfwwyWBJV). Jeg gætter på, at embedders vil spille en afgørende rolle i fremtidige fremskridt i vurderingen af generative modellers usikkerhed og generaliseringsadfærd.
— Sebastian G. Gruber (@SebGGruber) Oktober 30, 2023

Vi finder ud af, at AI-assistenten nøjagtigt tilpasser sin adfærd til at matche standardpolitikker fra den økonomiske litteratur (f.eks. selvisk, altruistisk). Imidlertid mangler assistentens indlærte politikker robusthed og udviser begrænset generalisering i en situation uden for distribution. pic.twitter.com/rK8junH67D
— Philipp Fränken (@jphilippfranken) Oktober 30, 2023

Ofte Stillede Spørgsmål

Let-til-hård generalisering refererer til processen med at træne eller lære modeller, algoritmer eller systemer ved gradvist at øge sværhedsgraden eller kompleksiteten af eksemplerne eller opgaver. Ideen bag let-til-hård generalisering er at starte med enklere eller nemmere eksempler og gradvist introducere mere udfordrende eller svære eksempler for at forbedre modellens evne til at generalisere og præstere godt på en bred vifte af input.

«Tilbage til ordlisteindeks

Ansvarsfraskrivelse

I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.

Om forfatteren

Damir er teamleder, produktchef og redaktør på Metaverse Post, der dækker emner som AI/ML, AGI, LLM'er, Metaverse og Web3-relaterede felter. Hans artikler tiltrækker et massivt publikum på over en million brugere hver måned. Han ser ud til at være en ekspert med 10 års erfaring i SEO og digital markedsføring. Damir er blevet nævnt i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto og andre publikationer. Han rejser mellem UAE, Tyrkiet, Rusland og SNG som en digital nomade. Damir tog en bachelorgrad i fysik, som han mener har givet ham de kritiske tænkningskompetencer, der er nødvendige for at få succes i internettets evigt skiftende landskab.

Flere artikler

Damir Yalalov