Novinky Technika
15. prosince 2022

Google vydává „GPT"podobný" model robota, RT-1

Google vydal nový model robota, RT-1, který je podobný GPT model použitý v jeho OpenAI program umělé inteligence. Nový model je navržen s ohledem na další robotické programy Google, včetně programu pro auta bez řidiče. Zde prezentovaný model RT-1 je krokem ke generativním modelům umělé inteligence v oblasti robotiky. V reálném světě dokáže RT-1 provést přes 700 instrukcí s úspěšností 97 %.

Google vydává „GPT"podobný" model robota, RT-1

Nedávné pokroky ve výzkumu strojového učení (ML), jako je počítačové vidění a zpracování přirozeného jazyka, byly umožněny sdíleným společným přístupem, který využívá velké, různorodé datové sady a expresivní modely. Ačkoli existovaly různé pokusy aplikovat tento přístup na robotiku, roboti dosud nepoužívali vysoce výkonné modely v takové míře jako jiné podobory.

Model zakóduje psaný příkaz a sadu obrázků jako tokeny pomocí předem trénovaného modelu FiLM EfficientNet před jejich komprimací pomocí TokenLearner. Toto je architektura RT-1. Transformátor je poté obdrží a vytvoří akční žetony.

Vývojáři shromáždili velkou a rozmanitou datovou sadu trajektorií robotů, aby vyvinuli systém, který by se dal zobecnit na nové úkoly a prokázat odolnost vůči různým rušivým vlivům a pozadím. Aby během 130 měsíců shromáždili 17 tisíc epizod, nasadili 13 robotických manipulátorů EDR, z nichž každý má rameno se 7 stupni volnosti, dvouprstý uchopovač a mobilní základnu. Výzkumníci použili lidské příklady získané vzdálenou teleoperací a každou událost označili písemným vysvětlením příkazu, který robot právě provedl. Sbírání a uspořádání předmětů, otevírání a zavírání zásuvek, vkládání předmětů do zásuvek a ze zásuvek, umisťování podlouhlých předmětů do svislé polohy, převracení předmětů, tahání ubrousků a otevírání sklenic patří mezi dovednosti na vysoké úrovni zahrnuté v datové sadě.

Následující video ukazuje několik ukázkových výkonů PaLM-SayCan-RT1 s dlouhým horizontem v několika skutečných kuchyních.

Ve všech čtyřech oblastech si RT-1 vede výrazně lépe než základní linie a vykazuje výjimečné úrovně zobecnění a odolnosti.

RT-1 Robotics Transformer je akční model pro robotické úkoly v reálném světě, který je jednoduchý a škálovatelný. Tokenizuje všechny vstupy a výstupy a komprimuje je pomocí předem vyškoleného modelu EfficientNet s ranou jazykovou fúzí a studentem tokenu. RT-1 demonstruje silný výkon ve stovkách úloh, stejně jako rozsáhlé zobecnění a robustnost v prostředí reálného světa.

Přečtěte si více:

Odmítnutí odpovědnosti

V souladu s Pokyny k projektu Trust, prosím vezměte na vědomí, že informace uvedené na této stránce nejsou určeny a neměly by být vykládány jako právní, daňové, investiční, finanční nebo jakékoli jiné formy poradenství. Je důležité investovat jen to, co si můžete dovolit ztratit, a v případě pochybností vyhledat nezávislé finanční poradenství. Pro další informace doporučujeme nahlédnout do smluvních podmínek a také na stránky nápovědy a podpory poskytnuté vydavatelem nebo inzerentem. MetaversePost se zavázala poskytovat přesné a nezaujaté zprávy, ale podmínky na trhu se mohou bez upozornění změnit.

O autorovi

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Další články
Damir Yalalov
Damir Yalalov

Damir je vedoucí týmu, produktový manažer a editor ve společnosti Metaverse Post, pokrývající témata jako AI/ML, AGI, LLM, Metaverse a Web3- související obory. Jeho články přitahují každý měsíc masivní publikum čítající více než milion uživatelů. Jeví se jako odborník s 10 lety zkušeností v oblasti SEO a digitálního marketingu. Damir byl zmíněn v Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto a další publikace. Jako digitální nomád cestuje mezi SAE, Tureckem, Ruskem a SNS. Damir získal bakalářský titul z fyziky, o kterém se domnívá, že mu dal dovednosti kritického myšlení potřebné k úspěchu v neustále se měnícím prostředí internetu. 

Přichází den odsouzení: Osud CZ visí v rovnováze, protože americký soud zvažuje žalobu ministerstva spravedlnosti

Changpeng Zhao je dnes připraven čelit rozsudku u amerického soudu v Seattlu.

Vědět více

Zakladatelé peněženky Samourai byli obviněni z usnadňování 2 miliard dolarů v obchodech Darknet

Obavy zakladatelů Peněženky Samourai představují pro průmysl významnou překážku, která podtrhuje přetrvávající ...

Vědět více
Připojte se k naší komunitě inovativních technologií
Více
Dozvědět se více
Pantera Capital investuje do blockchainu TON, vyjadřuje důvěru v potenciál Telegramu rozšířit dostupnost kryptoměn
Business Novinky Technika
Pantera Capital investuje do blockchainu TON, vyjadřuje důvěru v potenciál Telegramu rozšířit dostupnost kryptoměn
2
Mitosis získává finanční prostředky ve výši 7 milionů USD od Amber Group a Foresight Ventures, aby podpořila svůj modulární protokol likvidity
Business Novinky Technika
Mitosis získává finanční prostředky ve výši 7 milionů USD od Amber Group a Foresight Ventures, aby podpořila svůj modulární protokol likvidity
2
Galxe spolupracuje se společností Jambo, aby rozšířila globální dostupnost Web3
Business Novinky Technika
Galxe spolupracuje se společností Jambo, aby rozšířila globální dostupnost Web3
2
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
AI Wiki Novinky Vývoj Technika
Med-Gemini od Googlu se chystá dát náskok GPT-4 S vynikajícím výkonem ve zdravotnictví
2
CRYPTOMERIA LABS PTE. LTD.