Vijesti SMW Tehnologija
Lipnja 26, 2023

Meta AI razvija algoritam koji robotima omogućuje učenje zadataka iz YouTube videa

Ukratko

Istraživači su razvili model vizualne dostupnosti koristeći internetske videozapise ljudskog ponašanja kako bi osposobili robote za obavljanje složenih zadataka.

Ovaj pristup premošćuje jaz između statičkih skupova podataka i robotskih aplikacija u stvarnom svijetu.

Istraživači koriste velike video skupove podataka o ljudima kao što su Ego4D i Epic Kitchens kako bi izvukli mogućnosti, integrirajući tehnike računalnog vida s robotskom manipulacijom.

Koncept Vision-Robotics Bridge (VRB) prikazuje potencijal ovog pristupa, omogućujući robotima da uče iz ljudskih videa i stječu vještine potrebne za složene zadatke.

Meta AI predstavila je novi algoritam koji robotima omogućuje učenje i repliciranje ljudskih radnji gledanjem YouTube videa. U nedavnom radu pod naslovom "Affordances od Human Videos kao svestrani predstavnik za robotiku”, autori istražuju kako se videozapisi ljudskih interakcija mogu iskoristiti za treniranje robota za obavljanje složenih zadataka.

Meta AI razvija algoritam koji robotima omogućuje učenje zadataka iz YouTube videa
kredit: Metaverse Post (mpost.io)

Ovo istraživanje ima za cilj premostiti jaz između statičkih skupova podataka i aplikacija robota u stvarnom svijetu. Dok su prethodni modeli pokazali uspjeh na statičkim skupovima podataka, primjena ovih modela izravno na robote i dalje je izazov. Istraživači predlažu da bi rješenje moglo biti obučavanje modela vizualne dostupnosti korištenjem internetskih videozapisa ljudskog ponašanja. Ovaj model procjenjuje gdje i kako je vjerojatno da će čovjek komunicirati u sceni, pružajući vrijedne informacije za robote.

Koncept “priuštivosti” središnji je za ovaj pristup. Dopuštenja se odnose na potencijalne radnje ili interakcije koje objekt ili okolina nudi. Razumijevanjem mogućnosti putem ljudskih videa, robot dobiva svestran prikaz koji mu omogućuje obavljanje različitih složenih zadataka. Istraživači integriraju svoj model pristupačnosti s četiri različite paradigme robotskog učenja: izvanmrežno imitacijsko učenje, istraživanje, ciljno uvjetovano učenje i parametrizacija akcije za učenje učvršćivanja.

Preporučena: Top 100+ riječi koje detektori umjetne inteligencije mogu otkriti u 2023

Kako bi izvukli mogućnosti, istraživači koriste skupove video podataka velikih razmjera poput Ego4D i Epske kuhinje. Oni upotrebljavaju gotove detektore interakcije ruke i predmeta kako bi identificirali područje kontakta i pratili putanju zapešća nakon kontakta. Međutim, važan izazov javlja se kada je čovjek još uvijek prisutan u sceni, uzrokujući pomak distribucije. Da bi se pozabavili ovim problemom, istraživači koriste dostupne podatke kamere za projiciranje kontaktnih točaka i postkontaktne putanje na ljudsko-agnostički okvir, koji služi kao ulaz u njihov model.

Ranije su roboti bili sposobni oponašati radnje, ali su njihove sposobnosti bile ograničene na repliciranje određenih okruženja. S najnovijim algoritmom, istraživači su postigli značajan napredak u "generalizaciji" radnji robota. Roboti sada mogu primijeniti svoje stečeno znanje u novim i nepoznatim okruženjima. Ovo postignuće u skladu je s vizijom postizanja opće umjetne inteligencije (AGI) kao što zagovaraju istraživači umjetne inteligencije Jan LeCun.

Preporučena: GPT-4 Rješava ispitna pitanja MIT-a sa 100% točnošću? Nije točno, kažu istraživači
Model uzima ljudsko-agnostički okvir kao ulaz i proizvodi dva ključna izlaza
Model uzima ljudski-agnostički okvir kao ulaz i proizvodi dva ključna rezultata: kontaktnu toplinsku kartu i putne točke zapešća. Toplinska karta kontakta pokazuje vjerojatne točke kontakta, dok međutočke zapešća predviđaju putanju nakon kontakta. Ti se izlazi mogu izravno koristiti tijekom vremena zaključivanja, koristeći rijetke 3D informacije kao što su dubina i kinematika robota. / Zasluge: robo-affordances.github.io

Meta AI predana je unapređenju polja računalnog vida i planira podijeliti kod svog projekta i skup podataka. To će omogućiti drugim istraživačima i programerima da dalje istražuju i nadograđuju ovu tehnologiju. S povećanim pristupom kodu i skupu podataka, razvoj samoučećih robota sposobnih za stjecanje novih vještina od YouTube videozapisi nastavit će napredovati.

Model uzima ljudsko-agnostički okvir kao ulaz i proizvodi dva ključna izlaza
Kako bi procijenili učinkovitost svog pristupa, istraživači su proveli eksperimente u četiri stvarna okruženja koja su uključivala deset različitih zadataka i dvije robotske platforme koje rade u divljini. Rezultati su pokazali besprijekornu integraciju tehnike računalnog vida s robotskom manipulacijom, pokazujući potencijal njihovog koncepta Vision-Robotics Bridge (VRB). / Zasluge: robo-affordances.github.io

Koristeći ogromnu količinu online video zapisa s uputama, roboti mogu postati svestraniji i prilagodljiviji u različitim okruženjima.

Pročitajte više o AI:

Izjava o odricanju od odgovornosti

U skladu s Smjernice projekta povjerenja, imajte na umu da informacije navedene na ovoj stranici nemaju namjeru i ne smiju se tumačiti kao pravni, porezni, investicijski, financijski ili bilo koji drugi oblik savjeta. Važno je ulagati samo ono što si možete priuštiti izgubiti i potražiti neovisni financijski savjet ako imate bilo kakvih nedoumica. Za dodatne informacije predlažemo da pogledate odredbe i uvjete, kao i stranice za pomoć i podršku koje pruža izdavatelj ili oglašivač. MetaversePost je predan točnom, nepristranom izvješćivanju, ali tržišni uvjeti podložni su promjenama bez prethodne najave.

O autoru

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Više članaka
Damir Yalalov
Damir Yalalov

Damir je voditelj tima, product manager i urednik u Metaverse Post, koji pokriva teme kao što su AI/ML, AGI, LLMs, Metaverse i Web3- srodna polja. Njegovi članci privlače ogromnu publiku od preko milijun korisnika svakog mjeseca. Čini se da je stručnjak s 10 godina iskustva u SEO-u i digitalnom marketingu. Damir je spomenut u Mashableu, Wiredu, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i druge publikacije. Putuje između UAE, Turske, Rusije i CIS-a kao digitalni nomad. Damir je stekao diplomu prvostupnika fizike, za koju vjeruje da mu je dala vještine kritičkog razmišljanja potrebne za uspjeh u stalno promjenjivom okruženju interneta. 

Zatišje prije oluje Solana: Što sada govore grafikoni, kitovi i signali na lancu

Solana je pokazala snažne rezultate, potaknute sve većim usvajanjem, institucionalnim interesom i ključnim partnerstvima, dok se istovremeno suočava s potencijalnim ...

Znati više

Kriptovalute u travnju 2025.: Ključni trendovi, promjene i što slijedi

U travnju 2025. kripto prostor se usredotočio na jačanje osnovne infrastrukture, a Ethereum se pripremao za Pectru ...

Znati više
Opširnije
Čitaj više
Bitget Wallet imenuje veterana BCG-a Willa Wua za voditelja azijsko-pacifičke regije
posao Vijesti
Bitget Wallet imenuje veterana BCG-a Willa Wua za voditelja azijsko-pacifičke regije
12. veljače 2026.
Dvije trećine odraslih smatraju financijsku pismenost atraktivnom osobinom, pokazuje istraživanje OKX-a
Vijesti Tehnologija
Dvije trećine odraslih smatraju financijsku pismenost atraktivnom osobinom, pokazuje istraživanje OKX-a
12. veljače 2026.
Solus Partners objavljuje značajno izvješće o institucionalnom proboju Canton Networka: Što očekivati ​​u 2026. godini?
Vijesti Tehnologija
Solus Partners objavljuje značajno izvješće o institucionalnom proboju Canton Networka: Što očekivati ​​u 2026. godini?
12. veljače 2026.
Transak se integrira s MegaETH-om kako bi omogućio trenutni pristup pretvaranju fiat-u-ETH na visokobrzinskom sloju 2
Vijesti Tehnologija
Transak se integrira s MegaETH-om kako bi omogućio trenutni pristup pretvaranju fiat-u-ETH na visokobrzinskom sloju 2
12. veljače 2026.
CRYPTOMERIA LABS PTE. LTD.