Google släpper en "GPT-liknande robotmodell, RT-1
Google har släppt en ny robotmodell, RT-1, som liknar den GPT modell som används i dess OpenAI program för artificiell intelligens. Den nya modellen är designad med Googles andra robotprogram, inklusive dess förarlösa bilprogram, i åtanke. RT-1-modellen som presenteras här är ett steg mot generativa AI-modeller inom robotteknik. I den verkliga världen kan RT-1 utföra över 700 instruktioner med 97 % framgång.
De senaste framstegen inom forskning om maskininlärning (ML), såsom datorseende och naturlig språkbehandling, har möjliggjorts av ett gemensamt tillvägagångssätt som använder stora, olika datauppsättningar och uttrycksfulla modeller. Även om det har gjorts olika försök att tillämpa detta tillvägagångssätt på robotik, har robotar hittills inte använt högkapabla modeller lika mycket som andra delområden.
Utvecklare samlade en ansenlig, varierad datauppsättning av robotbanor för att utveckla ett system som kunde generalisera till nya uppgifter och demonstrera robusthet mot olika distraktioner och bakgrunder. För att samla in 130 17 avsnitt under 13 månader, satte de in 7 EDR-robotmanipulatorer, som var och en har en XNUMX-graders frihetsarm, en tvåfingergripare och en mobil bas. Forskarna använde mänskliga exempel som erhållits genom fjärroperation, och de markerade varje händelse med en skriftlig förklaring av kommandot som roboten just hade utfört. Att plocka och ordna föremål, öppna och stänga lådor, få föremål i och ur lådor, placera långsträckta föremål upprätt, välta föremål, dra servetter och öppna burkar är bland de färdigheter på hög nivå som ingår i datasetet.
Följande video visar några exempel på PaLM-SayCan-RT1-uppgifter med lång horisont i flera faktiska kök.
Inom alla fyra områden presterar RT-1 betydligt bättre än baslinjerna, och uppvisar exceptionella nivåer av generalisering och motståndskraft.
RT-1 Robotics Transformer är en actiongenererande modell för verkliga robotuppgifter som är enkel och skalbar. Den tokeniserar alla ingångar och utgångar och komprimerar dem med hjälp av en förtränad EfficientNet-modell med tidig språkfusion och en token-inlärare. RT-1 visar stark prestanda över hundratals uppgifter, såväl som omfattande generalisering och robusthet i verkliga miljöer.
Läs mer:
Villkor
I linje med den Riktlinjer för Trust Project, vänligen notera att informationen på den här sidan inte är avsedd att vara och inte ska tolkas som juridisk, skattemässig, investerings-, finansiell eller någon annan form av rådgivning. Det är viktigt att bara investera det du har råd att förlora och att söka oberoende finansiell rådgivning om du har några tvivel. För ytterligare information föreslår vi att du hänvisar till villkoren samt hjälp- och supportsidorna som tillhandahålls av utfärdaren eller annonsören. MetaversePost är engagerad i korrekt, opartisk rapportering, men marknadsförhållandena kan ändras utan föregående meddelande.
Om författaren
Damir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.
fler artiklarDamir är teamledare, produktchef och redaktör på Metaverse Post, som täcker ämnen som AI/ML, AGI, LLMs, Metaverse och Web3-relaterade områden. Hans artiklar lockar en massiv publik på över en miljon användare varje månad. Han verkar vara en expert med 10 års erfarenhet av SEO och digital marknadsföring. Damir har nämnts i Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto och andra publikationer. Han reser mellan Förenade Arabemiraten, Turkiet, Ryssland och OSS som en digital nomad. Damir tog en kandidatexamen i fysik, som han tror har gett honom de kritiska tänkande färdigheter som behövs för att bli framgångsrik i det ständigt föränderliga landskapet på internet.