Meta AI razvija algoritam koji robotima omogućuje učenje zadataka iz YouTube videa
Ukratko
Istraživači su razvili model vizualne dostupnosti koristeći internetske videozapise ljudskog ponašanja kako bi osposobili robote za obavljanje složenih zadataka.
Ovaj pristup premošćuje jaz između statičkih skupova podataka i robotskih aplikacija u stvarnom svijetu.
Istraživači koriste velike video skupove podataka o ljudima kao što su Ego4D i Epic Kitchens kako bi izvukli mogućnosti, integrirajući tehnike računalnog vida s robotskom manipulacijom.
Koncept Vision-Robotics Bridge (VRB) prikazuje potencijal ovog pristupa, omogućujući robotima da uče iz ljudskih videa i stječu vještine potrebne za složene zadatke.
Meta AI predstavila je novi algoritam koji robotima omogućuje učenje i repliciranje ljudskih radnji gledanjem YouTube videa. U nedavnom radu pod naslovom "Affordances od Human Videos kao svestrani predstavnik za robotiku”, autori istražuju kako se videozapisi ljudskih interakcija mogu iskoristiti za treniranje robota za obavljanje složenih zadataka.
Ovo istraživanje ima za cilj premostiti jaz između statičkih skupova podataka i aplikacija robota u stvarnom svijetu. Dok su prethodni modeli pokazali uspjeh na statičkim skupovima podataka, primjena ovih modela izravno na robote i dalje je izazov. Istraživači predlažu da bi rješenje moglo biti obučavanje modela vizualne dostupnosti korištenjem internetskih videozapisa ljudskog ponašanja. Ovaj model procjenjuje gdje i kako je vjerojatno da će čovjek komunicirati u sceni, pružajući vrijedne informacije za robote.
Koncept “priuštivosti” središnji je za ovaj pristup. Dopuštenja se odnose na potencijalne radnje ili interakcije koje objekt ili okolina nudi. Razumijevanjem mogućnosti putem ljudskih videa, robot dobiva svestran prikaz koji mu omogućuje obavljanje različitih složenih zadataka. Istraživači integriraju svoj model pristupačnosti s četiri različite paradigme robotskog učenja: izvanmrežno imitacijsko učenje, istraživanje, ciljno uvjetovano učenje i parametrizacija akcije za učenje učvršćivanja.
Kako bi izvukli mogućnosti, istraživači koriste skupove video podataka velikih razmjera poput Ego4D i Epske kuhinje. Oni upotrebljavaju gotove detektore interakcije ruke i predmeta kako bi identificirali područje kontakta i pratili putanju zapešća nakon kontakta. Međutim, važan izazov javlja se kada je čovjek još uvijek prisutan u sceni, uzrokujući pomak distribucije. Da bi se pozabavili ovim problemom, istraživači koriste dostupne podatke kamere za projiciranje kontaktnih točaka i postkontaktne putanje na ljudsko-agnostički okvir, koji služi kao ulaz u njihov model.
Ranije su roboti bili sposobni oponašati radnje, ali su njihove sposobnosti bile ograničene na repliciranje određenih okruženja. S najnovijim algoritmom, istraživači su postigli značajan napredak u "generalizaciji" radnji robota. Roboti sada mogu primijeniti svoje stečeno znanje u novim i nepoznatim okruženjima. Ovo postignuće u skladu je s vizijom postizanja opće umjetne inteligencije (AGI) kao što zagovaraju istraživači umjetne inteligencije Jan LeCun.
Meta AI predana je unapređenju polja računalnog vida i planira podijeliti kod svog projekta i skup podataka. To će omogućiti drugim istraživačima i programerima da dalje istražuju i nadograđuju ovu tehnologiju. S povećanim pristupom kodu i skupu podataka, razvoj samoučećih robota sposobnih za stjecanje novih vještina od YouTube videozapisi nastavit će napredovati.
Koristeći ogromnu količinu online video zapisa s uputama, roboti mogu postati svestraniji i prilagodljiviji u različitim okruženjima.
Pročitajte više o AI:
Izjava o odricanju od odgovornosti
U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.
O autoru
Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.
Više članaka
Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta.