Meta introducerer Segment Anything, dens nye AI-model til billedsegmentering
Kort sagt
Meta har introduceret Segment Anything, sin nye grundmodel til billedsegmentering.
Virksomheden åbner to store datasæt, der bruges til at træne AI-modellen.
Meta siger, at Segment Anything kunne blive en komponent i større AI-systemer til at forstå både det visuelle og tekstmæssige indhold af en webside.
Meta har introduceret Segment Anything, sin nye grundmodel til billedsegmentering. Processen med at identificere, hvilke billedpixel der tilhører et objekt, er en afgørende opgave i computersyn og bruges i en række forskellige applikationer, fra analyse af videnskabelige billeder til redigering af fotos.
I sin indledning blogindlæg, satte virksomheden scenen ved at sige, at skabelse af nøjagtige segmenteringsmodeller til specifikke opgaver inden for computervision typisk har krævet specialiseret arbejde af tekniske eksperter med adgang til AI-træningsinfrastruktur og store mængder af omhyggeligt annoterede in-domænedata.
Dette kan dog snart ændre sig med Segment Anything-projektet, da dets nye datasæt og model forventes at gøre nøjagtige segmenteringsmodeller mere tilgængelige for et bredere publikum, hvilket eliminerer behovet for specialiseret teknisk ekspertise og infrastruktur. For at opnå det byggede forskerne en prompt-model, der er trænet på forskellige data og kan tilpasse sig specifikke opgaver, svarende til hvordan prompting bruges i naturlige sprogbehandlingsmodeller eller chatbots.
For yderligere at demokratisere segmentering gør Meta det massive SA-1B-datasæt tilgængeligt til forskningsformål, og Segment Anything-modellen er tilgængelig under en tilladelig åben licens (Apache 2.0). Derudover har virksomheden udviklet en demo der giver brugerne mulighed for at prøve SAM med deres egne billeder.
Meta ser potentielle use cases for SAM i AI-, AR/VR- og skaberdomænerne. SAM har potentialet til at blive et kritisk element i større AI-systemer, der har til formål at opnå en mere generel multimodal forståelse af verden. For eksempel kan det lette forståelsen af både visuelt og tekstmæssigt indhold på en webside.
Derudover kunne SAM i AR/VR-domænet muliggøre objektvalg baseret på en brugers blik og tillade objektet at blive "løftet" ind i 3D. Desuden kan indholdsskabere bruge SAM til at forbedre kreative applikationer, såsom at udtrække billedområder til collager eller videoredigering.
Meta har øget sin AI-indsats midt i det generative AI-boom og aftagende interesse for metaverset. På trods af virksomhedens 70 milliarder dollars satsning på metaverse, oplevede dens metaverse division Reality Labs et tab på 13.7 milliarder dollar sidste år. For nylig, Meta også solnedgang sin NFT drift på Facebook og Instagram.
I et interview med Nikkei Asien onsdag sagde Meta CTO Chris Bosworth, at Metas topledere har brugt det meste af deres tid på AI. Meta CEO Mark Zuckerberg annoncerede i februar en ny produktgruppe fokuseret på generativ AI efter frigive sin nye store sprogmodel kaldet LLaMA (Large Language Model Meta AI).
Virksomheden forventes at debutere nogle annonce-skabende AI-applikationer i år, fortalte Bosworth til Nikkei.
Læs mere:
Ansvarsfraskrivelse
I tråd med den Trust Project retningslinjer, bemærk venligst, at oplysningerne på denne side ikke er beregnet til at være og ikke skal fortolkes som juridiske, skattemæssige, investeringsmæssige, finansielle eller nogen anden form for rådgivning. Det er vigtigt kun at investere, hvad du har råd til at tabe, og at søge uafhængig finansiel rådgivning, hvis du er i tvivl. For yderligere information foreslår vi at henvise til vilkårene og betingelserne samt hjælpe- og supportsiderne fra udstederen eller annoncøren. MetaversePost er forpligtet til nøjagtig, objektiv rapportering, men markedsforholdene kan ændres uden varsel.
Om forfatteren
Cindy er journalist på Metaverse Post, der dækker emner relateret til web3, NFT, metaverse og AI, med fokus på interviews med Web3 industriens aktører. Hun har talt med over 30 ledere på C-niveau, og hun har bragt deres værdifulde indsigt til læserne. Oprindeligt fra Singapore, Cindy er nu baseret i Tbilisi, Georgia. Hun har en bachelorgrad i kommunikations- og mediestudier fra University of South Australia og har ti års erfaring med journalistik og forfatterskab. Kontakt hende via [e-mail beskyttet] med pressepitches, annonceringer og interviewmuligheder.
Flere artiklerCindy er journalist på Metaverse Post, der dækker emner relateret til web3, NFT, metaverse og AI, med fokus på interviews med Web3 industriens aktører. Hun har talt med over 30 ledere på C-niveau, og hun har bragt deres værdifulde indsigt til læserne. Oprindeligt fra Singapore, Cindy er nu baseret i Tbilisi, Georgia. Hun har en bachelorgrad i kommunikations- og mediestudier fra University of South Australia og har ti års erfaring med journalistik og forfatterskab. Kontakt hende via [e-mail beskyttet] med pressepitches, annonceringer og interviewmuligheder.