Google udostępnia „GPTpodobny” model robota, RT-1
Google wypuściło nowy model robota, RT-1, który jest podobny do GPT zastosowany w nim model OpenAI program sztucznej inteligencji. Nowy model został zaprojektowany z myślą o innych programach robotyki Google, w tym o programie samochodów bez kierowcy. Przedstawiony tutaj model RT-1 jest krokiem w kierunku generatywnych modeli AI w dziedzinie robotyki. W prawdziwym świecie RT-1 może wykonać ponad 700 instrukcji z 97% skutecznością.
Ostatnie postępy w badaniach nad uczeniem maszynowym (ML), takie jak wizja komputerowa i przetwarzanie języka naturalnego, były możliwe dzięki wspólnemu wspólnemu podejściu, które wykorzystuje duże, różnorodne zbiory danych i ekspresyjne modele. Chociaż podejmowano różne próby zastosowania tego podejścia w robotyce, jak dotąd roboty nie wykorzystywały modeli o dużych możliwościach w takim stopniu, jak inne poddziedziny.
Deweloperzy zgromadzili pokaźny, zróżnicowany zestaw danych trajektorii robotów, aby opracować system, który można uogólniać do nowych zadań i wykazywać odporność na różne czynniki rozpraszające uwagę i tła. Aby zebrać 130 17 odcinków w ciągu 13 miesięcy, wdrożyli 7 manipulatorów robotów EDR, z których każdy ma ramię o XNUMX stopniach swobody, chwytak z dwoma palcami i mobilną podstawę. Naukowcy wykorzystali ludzkie przykłady uzyskane dzięki zdalnej teleoperacji i oznaczyli każde zdarzenie pisemnym wyjaśnieniem polecenia, które właśnie wykonał robot. Wybieranie i układanie przedmiotów, otwieranie i zamykanie szuflad, wkładanie i wyjmowanie przedmiotów z szuflad, ustawianie wydłużonych przedmiotów w pozycji pionowej, przewracanie przedmiotów, wyciąganie serwetek i otwieranie słoików należą do umiejętności wysokiego poziomu zawartych w zbiorze danych.
Poniższy film przedstawia kilka przykładowych zadań PaLM-SayCan-RT1 o długim horyzoncie w kilku rzeczywistych kuchniach.
We wszystkich czterech obszarach RT-1 działa znacznie lepiej niż linie bazowe, wykazując wyjątkowy poziom uogólnienia i odporności.
RT-1 Robotics Transformer to prosty i skalowalny model do generowania akcji dla rzeczywistych zadań robotyki. Tokenizuje wszystkie dane wejściowe i wyjściowe oraz kompresuje je przy użyciu wstępnie wytrenowanego modelu EfficientNet z wczesną fuzją językową i uczeniem tokena. RT-1 wykazuje wysoką wydajność w setkach zadań, a także szerokie uogólnienie i solidność w rzeczywistych ustawieniach.
Dowiedz się więcej:
Odpowiedzialność
Zgodnie z Zaufaj wytycznym projektu, należy pamiętać, że informacje zawarte na tej stronie nie mają na celu i nie powinny być interpretowane jako porady prawne, podatkowe, inwestycyjne, finansowe lub jakiekolwiek inne formy porad. Ważne jest, aby inwestować tylko tyle, na utratę czego możesz sobie pozwolić, a w przypadku jakichkolwiek wątpliwości zasięgnąć niezależnej porady finansowej. Aby uzyskać więcej informacji, sugerujemy zapoznać się z warunkami oraz stronami pomocy i wsparcia udostępnianymi przez wydawcę lub reklamodawcę. MetaversePost zobowiązuje się do sporządzania dokładnych i bezstronnych raportów, jednakże warunki rynkowe mogą ulec zmianie bez powiadomienia.
O autorze
Damir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.
Więcej artykułówDamir jest liderem zespołu, menedżerem produktu i redaktorem w Metaverse Post, obejmujący takie tematy, jak AI/ML, AGI, LLM, Metaverse i Web3-pokrewne pola. Jego artykuły przyciągają każdego miesiąca ogromną publiczność, liczącą ponad milion użytkowników. Wydaje się być ekspertem z 10-letnim doświadczeniem w SEO i marketingu cyfrowym. Damir został wspomniany w Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto i inne publikacje. Jako cyfrowy koczownik podróżuje między ZEA, Turcją, Rosją i WNP. Damir uzyskał tytuł licencjata z fizyki, co jego zdaniem dało mu umiejętności krytycznego myślenia potrzebne do odniesienia sukcesu w ciągle zmieniającym się środowisku internetowym.