Fizinis intelektas pristato MEM architektūrą, kad robotai gautų atminties, reikalingos realioms užduotims atlikti
Trumpai
Tyrėjai sukūrė daugiamačio įkūnyto atminties sistemą, kuri suteikia robotams trumpalaikę ir ilgalaikę atmintį, kad jie galėtų stebėti progresą ir atlikti sudėtingas užduotis, o ne tik atlikti atskirus veiksmus.
Jau daugelį metų svajonė apie tikrai naudingą buitinį robotą buvo apgaulingai arti. Robotai jau gali vykdyti tokias komandas kaip „išplauti keptuvę“, „sulankstyti skalbinius“ arba „pasidaryti sumuštinį“. Laboratorinėje aplinkoje šios sistemos demonstruoja įspūdingą miklumą ir tikslumą. Tačiau nepaisant sparčios robotų pamatų modelių pažangos, trūksta kažko esminio: atminties.
Robotas, galintis atlikti vieną užduotį, nėra tas pats, kas robotas, galintis užbaigti darbą. Visos virtuvės valymas, maisto gaminimas ar ingredientų paruošimas pagal receptą reikalauja daugiau nei izoliuotų įgūdžių. Tam reikia tęstinumo – gebėjimo prisiminti, kas jau buvo padaryta, kas dar turi įvykti ir kur viskas yra. Be šio pasakojimo gijos net ir pats pajėgiausias robotas tampa stebėtinai nekompetentingas.
Tai yra iššūkis, kurį „Physical Intelligence“ tyrėjai dabar bando išspręsti naudodami naują architektūrą, vadinamą daugiamačiu įterptuoju atmintimi (MEM) – sistema, sukurta suteikti robotams tiek trumpalaikę, tiek ilgalaikę atmintį, kad jie galėtų atlikti užduotis, kurios vyksta per kelias minutes, o ne sekundes.
Rezultatai užuomina apie kai ką svarbaus: robotikos ateitis gali mažiau priklausyti nuo geresnių mechaninių rankų ir labiau nuo geresnės kognityvinės architektūros.
Šiuolaikiniai robotų modeliai jau turi įspūdingą motorinių įgūdžių biblioteką. Jie gali suimti trapius daiktus, valdyti įrankius ir orientuotis netvarkingoje aplinkoje. Tačiau paprašykite roboto išvalyti visą virtuvę – nuvalyti stalviršius, sudėti maisto produktus į vietas, išplauti indus ir sutvarkyti stalo įrankius – ir apribojimai greitai tampa akivaizdūs.
Problema yra ne patys įgūdžiai. Problema yra ta, kaip tie įgūdžiai koordinuojami. Sudėtingoms užduotims atlikti reikalingas nuolatinis sąmoningumas. Robotas turi atsiminti, kurias spinteles jau atidarė, kur padėjo puodo dangtį ar ar jau plovė indą. Jis taip pat turi sekti objektus, kurie pasislenka iš matymo lauko, ir, atlikdamas naujus veiksmus, išlaikyti aplinkos mentalinį žemėlapį.
Žmogaus pažinimas tai daro be vargo. Mašinos iki šiol to nedarė. Kiekvieno roboto matomo stebėjimo saugojimas kelias minutes ar valandas yra skaičiavimo požiūriu neįmanomas. Tačiau šios informacijos atmetimas sukelia chaotišką elgesį – pasikartojančias klaidas, pamirštus veiksmus arba veiksmus, kurie prieštarauja ankstesniems sprendimams. Robotikos tyrimuose šis iššūkis kartais apibūdinamas kaip „priežastinis painiava“, kai sistemos neteisingai interpretuoja praeities įvykius ir sustiprina neteisingą elgesį.
Rezultatas: robotai, kurie trumpose demonstracijose atrodo įspūdingai, bet sunkiai atlieka realias užduotis.
Fizinio intelekto atminties sistema
MEM architektūra šią problemą sprendžia įdiegdama daugiasluoksnę atminties struktūrą. Užuot viską saugojusi vienodai, sistema atmintį padalija į dvi viena kitą papildančias formas:
Trumpalaikė vaizdinė atmintis fiksuoja naujausius stebėjimus naudodama efektyvią vaizdo kodavimo architektūrą. Tai leidžia robotui suprasti judesį, sekti objektus skirtinguose kadruose ir prisiminti įvykius, įvykusius prieš kelias sekundes – tai labai svarbu atliekant tikslius veiksmus, tokius kaip kepto sūrio sumuštinio apvertimas ar indų šveitimas.
Tuo tarpu ilgalaikė konceptualioji atmintis užduočių eigą saugo natūralia kalba. Užuot įsiminusi neapdorotus vaizdinius duomenisdefiGaliausiai robotas rašo trumpus tekstinius „pastabas“, aprašydamas, kas įvyko – tokius teiginius kaip „Padėjau puodą į kriauklę“ arba „Išėmiau pieną iš šaldytuvo“.
Šios santraukos tampa roboto samprotavimo proceso dalimi. Iš esmės, mašina sukuria savo užduoties naratyvą. Sistemos samprotavimo variklis vienu metu nusprendžia du dalykus: kokį veiksmą atlikti toliau ir kokią informaciją verta atsiminti. Šis derinys leidžia modeliui sekti užduotis, trunkančias iki penkiolikos minučių – daug ilgiau nei daugumoje ankstesnių robotų demonstracijų.
Vienas įdomiausių MEM suteikiamų galimybių yra prisitaikymas prie konteksto. Robotai daro klaidas. Tai neišvengiama. Tačiau dauguma robotinių sistemų kartoja tas klaidas be galo, nes neturi gedimų atminties.
Skirtumas išryškėja atliekant paprastus eksperimentus. Vieno bandymo metu robotas bando paimti plokščią valgomąją lazdelę. Neturėdamas atminties, robotas pakartotinai bando nesėkmingai paimti tą patį lazdelę. Įjungus atmintį, robotas prisimena nesėkmingą bandymą ir bando atlikti kitą veiksmą – galiausiai jam pavyksta.
Kitas pavyzdys – šaldytuvo atidarymas. Vien tik iš vizualinių duomenų robotas negali iš karto nustatyti, kuria kryptimi atsidaro durys. Sistema be atminties tiesiog kartoja tą patį veiksmą vėl ir vėl. Robotas su atmintimi bando atidaryti vieną pusę, prisimena gedimą ir tada bando atidaryti kitą pusę.
Šie maži pakeitimai atspindi kažką gilaus: gebėjimą mokytis pačios užduoties metu. Užuot visiškai pasikliavęs mokymo duomenimis, robotas prisitaiko akimirksniu.
Tyrėjai įvertino atminties pagrindu veikiančią sistemą vis sudėtingesnėms užduotims atlikti. Pirmiausia iškilo gana paprastas iššūkis: kepto sūrio sumuštinio gaminimas. Tam reikėjo trumpalaikės atminties, kad būtų galima valdyti laiką atliekant tokius subtilius fizinius veiksmus kaip duonos vartymas ir sumuštinio patiekimas.
Toliau sekė logistinė užduotis: surasti ingredientus pagal receptą. Robotas turėjo atsiminti, kuriuos ingredientus jau surinko, kur jie yra ir ar stalčiai bei spintelės buvo uždaryti. Galiausiai atėjo sudėtingiausias scenarijus: išvalyti visą virtuvę.
Tai reiškė daiktų sudėliojimą, indų plovimą, stalviršių valymą ir stebėjimą, kurios kambario dalys jau buvo išvalytos.
Atminties papildymu pagrįstas modelis gerokai pranoko versijas be struktūrizuotos atminties, parodydamas didesnį patikimumą ir užduočių atlikimo greitį.
Šis skirtumas iliustruoja esminį robotikos pokytį. Užuot optimizavę atskirus veiksmus, tyrėjai dabar kuria sistemas, galinčias užtikrinti tvarius darbo eigą.
Kodėl atmintis yra kita robotikos sritis
Platesnė MEM reikšmė yra ta, kad robotika žengia į naują etapą. Dešimtmečius ši sritis daugiausia dėmesio skyrė suvokimui ir valdymui: pagalbai mašinoms matyti pasaulį ir manipuliuoti objektais. Visai neseniai dideli multimodaliniai modeliai smarkiai pagerino robotų gebėjimą interpretuoti instrukcijas ir vykdyti sudėtingą motorinį elgesį.
Tačiau šiems gebėjimams bręstant, kliūtis pasitraukė. Kitas iššūkis yra kognityvinis tęstinumas – suteikti robotams galimybę veikti ilgą laiką neprarandant savo tikslų. Tokios atminties sistemos kaip MEM suteikia pagrindą šiam tęstinumui. Užuot reagavę akimirka po akimirkos, robotai gali palaikyti vidinį pasakojimą apie savo veiksmus, sprendimus ir aplinką. Šis pasakojimas leidžia atsirasti sudėtingam elgesiui.
Jei šis metodas ir toliau vystysis, pasekmės apims ne tik virtuvių valymą. Ateities robotams gali tekti vykdyti instrukcijas, kurios atsiskleidžia per kelias valandas ar net dienas. Įsivaizduokite, kad sakote namų asistentui:
„Grįžu namo 6 val. – prašau, paruoškite vakarienę ir sutvarkykite namus trečiadieniais.“
Tokiam prašymui vykdyti reikėtų išanalizuoti ilgas instrukcijas, planuoti dalines užduotis, prisiminti progresą ir prisitaikyti, kai kas nors nepavyksta.
Taip ilgai išlaikyti neapdorotą kiekvieno veiksmo vaizdo istoriją būtų neįmanoma. Vietoj to, robotai greičiausiai remsis hierarchinėmis atminties sistemomis, kuriose patirtis suspaudžiama į vis abstraktesnius atvaizdavimus.
MEM yra pirmas žingsnis tokios architektūros link. Tai rodo, kad galingesnių robotų raktas gali būti ne galingesni varikliai ar aštresni jutikliai, o geresnė atmintis ir gebėjimas apie tai samprotauti. Jei robotai pagaliau prisimins, ką daro, jie taip pat gali pagaliau užbaigti darbą.
Atsakomybės neigimas
Remdamasi tuo, Pasitikėjimo projekto gairės, atkreipkite dėmesį, kad šiame puslapyje pateikta informacija nėra skirta ir neturėtų būti aiškinama kaip teisinė, mokesčių, investicinė, finansinė ar bet kokia kita konsultacija. Svarbu investuoti tik tai, ką galite sau leisti prarasti, ir, jei turite kokių nors abejonių, kreiptis į nepriklausomą finansinę konsultaciją. Norėdami gauti daugiau informacijos, siūlome peržiūrėti taisykles ir nuostatas bei pagalbos ir palaikymo puslapius, kuriuos pateikia išdavėjas arba reklamuotojas. MetaversePost yra įsipareigojusi teikti tikslias, nešališkas ataskaitas, tačiau rinkos sąlygos gali keistis be įspėjimo.
Apie autorių
Alisa, atsidavusi žurnalistė MPost, specializuojasi kriptovaliutų, dirbtinio intelekto, investicijų ir plačios srities srityse Web3. Akylai žvelgdama į naujas tendencijas ir technologijas, ji pateikia išsamią informaciją, kad informuotų ir įtrauktų skaitytojus į nuolat besikeičiančią skaitmeninių finansų aplinką.
Daugiau straipsnių
Alisa, atsidavusi žurnalistė MPost, specializuojasi kriptovaliutų, dirbtinio intelekto, investicijų ir plačios srities srityse Web3. Akylai žvelgdama į naujas tendencijas ir technologijas, ji pateikia išsamią informaciją, kad informuotų ir įtrauktų skaitytojus į nuolat besikeičiančią skaitmeninių finansų aplinką.



