Meta predstavlja Segment Anything, svoj novi model AI za segmentacijo slike
Na kratko
Meta je predstavila Segment Anything, svoj novi temeljni model za segmentacijo slik.
Podjetje odprtokodno nabavlja dva velika nabora podatkov, ki se uporabljata za usposabljanje modela AI.
Meta pravi, da bi Segment Anything lahko postal komponenta v večjih sistemih AI za razumevanje vizualne in besedilne vsebine spletne strani.
Meta je predstavila Segment Anything, svoj novi temeljni model za segmentacijo slik. Postopek ugotavljanja, katere slikovne pike pripadajo objektu, je ključna naloga v računalniškem vidu in se uporablja v različnih aplikacijah, od analize znanstvenih posnetkov do urejanja fotografij.
V svojem uvodnem blog post, je podjetje postavilo prizorišče z besedami, da ustvarjanje natančnih modelov segmentacije za posebne naloge v računalniškem vidu običajno zahteva specializirano delo tehničnih strokovnjakov z dostopom do infrastrukture za usposabljanje AI in velike količine skrbno označenih podatkov v domeni.
Vendar se lahko to kmalu spremeni s projektom Segment Anything, saj naj bi njegov novi nabor podatkov in model naredila natančne modele segmentacije bolj dostopne širšemu občinstvu, s čimer bo odpravljena potreba po specializiranem tehničnem znanju in infrastrukturi. Da bi to dosegli, so raziskovalci zgradili model s pozivi, ki je usposobljen na različnih podatkih in se lahko prilagodi specifičnim nalogam, podobno kot se nagovarjanje uporablja v modelih za obdelavo naravnega jezika ali chatbotih.
Za nadaljnjo demokratizacijo segmentacije Meta daje na voljo ogromen nabor podatkov SA-1B za raziskovalne namene, model Segment Anything pa je na voljo pod permisivno odprto licenco (Apache 2.0). Poleg tega je podjetje razvilo a demo ki uporabnikom omogoča, da preizkusijo SAM z lastnimi slikami.
Meta vidi možne primere uporabe za SAM v domenah AI, AR/VR in ustvarjalcev. SAM ima potencial, da postane kritičen element v večjih sistemih umetne inteligence, katerih cilj je doseči bolj splošno multimodalno razumevanje sveta. Na primer, lahko olajša razumevanje vizualne in besedilne vsebine na spletni strani.
Poleg tega bi lahko v domeni AR/VR SAM omogočil izbiro predmeta na podlagi uporabnikovega pogleda in omogočil, da se predmet "dvigne" v 3D. Poleg tega lahko ustvarjalci vsebin uporabljajo SAM za izboljšanje ustvarjalnih aplikacij, kot je ekstrahiranje slikovnih regij za kolaže ali urejanje videa.
Meta krepi svoja prizadevanja v zvezi z umetno inteligenco sredi generativnega razmaha umetne inteligence in vse manjšega zanimanja za metaverzum. Kljub temu, da je podjetje stavilo na metaverzum v višini 70 milijard dolarjev, je njegov oddelek za metaverzum Reality Labs lani zabeležil izgubo v višini 13.7 milijarde ameriških dolarjev. Pred kratkim je tudi Meta zašla NFT delovanje na Facebooku in Instagramu.
V intervjuju z Nikkei Azija v sredo je tehnični direktor Mete Chris Bosworth dejal, da vodilni delavci Mete večino svojega časa namenjajo AI. Izvršni direktor Mete Mark Zuckerberg razglasitve februarja nova skupina izdelkov, osredotočena na generativno umetno inteligenco po sprošča njegov novi veliki jezikovni model, imenovan LLaMA (Large Language Model Meta AI).
Podjetje naj bi letos predstavilo nekaj aplikacij AI za ustvarjanje oglasov, je povedal Bosworth za Nikkei.
Preberite več:
Zavrnitev odgovornosti
V skladu z Smernice projekta Trust, upoštevajte, da informacije na tej strani niso namenjene in se jih ne sme razlagati kot pravni, davčni, naložbeni, finančni ali kakršen koli drug nasvet. Pomembno je, da vlagate samo tisto, kar si lahko privoščite izgubiti, in da poiščete neodvisen finančni nasvet, če imate kakršne koli dvome. Za dodatne informacije predlagamo, da si ogledate določila in pogoje ter strani s pomočjo in podporo, ki jih nudi izdajatelj ali oglaševalec. MetaversePost se zavzema za natančno in nepristransko poročanje, vendar se tržni pogoji lahko spremenijo brez predhodnega obvestila.
O avtorju
Cindy je novinarka pri Metaverse Post, ki pokriva teme, povezane z web3, NFT, metaverse in AI, s poudarkom na intervjujih z Web3 akterji v industriji. Pogovarjala se je z več kot 30 vodstvenimi delavci na ravni C in jih je še vedno več, pri čemer je bralcem posredovala njihove dragocene vpoglede. Cindy, ki izvira iz Singapurja, je zdaj v Tbilisiju v Gruziji. Ima diplomo iz komunikacijskih in medijskih študij na Univerzi v Južni Avstraliji in ima desetletje izkušenj z novinarstvom in pisanjem. Stopite v stik z njo prek [e-pošta zaščitena] z novinarskimi predstavitvami, napovedmi in priložnostmi za intervjuje.
več člankovCindy je novinarka pri Metaverse Post, ki pokriva teme, povezane z web3, NFT, metaverse in AI, s poudarkom na intervjujih z Web3 akterji v industriji. Pogovarjala se je z več kot 30 vodstvenimi delavci na ravni C in jih je še vedno več, pri čemer je bralcem posredovala njihove dragocene vpoglede. Cindy, ki izvira iz Singapurja, je zdaj v Tbilisiju v Gruziji. Ima diplomo iz komunikacijskih in medijskih študij na Univerzi v Južni Avstraliji in ima desetletje izkušenj z novinarstvom in pisanjem. Stopite v stik z njo prek [e-pošta zaščitena] z novinarskimi predstavitvami, napovedmi in priložnostmi za intervjuje.