Rapport de nouvelles Technologie
15 décembre 2022

Google publie un "GPT"-like", le modèle de robot RT-1

Google a publié un nouveau modèle de robot, le RT-1, similaire au GPT modèle utilisé dans son OpenAI programme d'intelligence artificielle. Le nouveau modèle est conçu en tenant compte des autres programmes de robotique de Google, y compris son programme de voiture sans conducteur. Le modèle RT-1 présenté ici est une étape vers des modèles d'IA générative dans le domaine de la robotique. Dans le monde réel, le RT-1 peut exécuter plus de 700 instructions avec un taux de réussite de 97 %.

Google publie un "GPT"-like", le modèle de robot, le RT-1

Les avancées récentes dans la recherche sur l'apprentissage automatique (ML), telles que la vision par ordinateur et le traitement du langage naturel, ont été rendues possibles par une approche commune partagée qui utilise des ensembles de données vastes et diversifiés et des modèles expressifs. Bien qu'il y ait eu diverses tentatives pour appliquer cette approche à la robotique, les robots n'ont jusqu'à présent pas utilisé des modèles hautement performants autant que d'autres sous-domaines.

Le modèle encode une commande écrite et un ensemble d'images sous forme de jetons à l'aide d'un modèle FiLM EfficientNet pré-formé avant de les compresser à l'aide de TokenLearner. C'est l'architecture de RT-1. Le transformateur les reçoit ensuite et produit des jetons d'action.

Les développeurs ont rassemblé un ensemble de données important et varié de trajectoires de robots afin de développer un système qui pourrait se généraliser à de nouvelles tâches et démontrer sa robustesse à diverses distractions et arrière-plans. Pour rassembler 130 17 épisodes sur 13 mois, ils ont déployé 7 robots manipulateurs EDR, chacun doté d'un bras à XNUMX degrés de liberté, d'une pince à deux doigts et d'une base mobile. Les chercheurs ont utilisé des exemples humains obtenus par téléopération à distance, et ils ont marqué chaque événement par une explication écrite de la commande que le robot venait d'exécuter. Choisir et ranger des objets, ouvrir et fermer des tiroirs, faire entrer et sortir des objets dans des tiroirs, positionner des objets allongés à la verticale, renverser des objets, tirer des serviettes et ouvrir des bocaux font partie des compétences de haut niveau incluses dans l'ensemble de données.

La vidéo suivante montre quelques exemples de performances de tâches à long horizon PaLM-SayCan-RT1 dans plusieurs cuisines réelles.

Dans les quatre domaines, RT-1 fonctionne nettement mieux que les lignes de base, affichant des niveaux exceptionnels de généralisation et de résilience.

Le transformateur robotique RT-1 est un modèle de génération d'action pour les tâches robotiques du monde réel, simple et évolutif. Il tokenise toutes les entrées et sorties et les compresse à l'aide d'un modèle EfficientNet pré-formé avec une fusion linguistique précoce et un apprenant de jeton. RT-1 démontre de solides performances sur des centaines de tâches, ainsi qu'une généralisation et une robustesse étendues dans des contextes réels.

En savoir plus:

Clause de non-responsabilité 

En ligne avec la Lignes directrices du projet de confiance, veuillez noter que les informations fournies sur cette page ne sont pas destinées à être et ne doivent pas être interprétées comme des conseils juridiques, fiscaux, d'investissement, financiers ou toute autre forme de conseil. Il est important d’investir uniquement ce que vous pouvez vous permettre de perdre et de demander des conseils financiers indépendants en cas de doute. Pour plus d'informations, nous vous suggérons de vous référer aux conditions générales ainsi qu'aux pages d'aide et de support mises à disposition par l'émetteur ou l'annonceur. MetaversePost s'engage à fournir des rapports précis et impartiaux, mais les conditions du marché sont susceptibles de changer sans préavis.

A propos de l'auteur

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Plus d'articles
Damir Yalalov
Damir Yalalov

Damir est chef d'équipe, chef de produit et rédacteur en chef chez Metaverse Post, couvrant des sujets tels que l'IA/ML, l'AGI, les LLM, le métaverse et Web3-domaines connexes. Ses articles attirent une audience massive de plus d'un million d'utilisateurs chaque mois. Il semble être un expert avec 10 ans d'expérience dans le référencement et le marketing numérique. Damir a été mentionné dans Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto et d'autres publications. Il voyage entre les Émirats arabes unis, la Turquie, la Russie et la CEI en tant que nomade numérique. Damir a obtenu un baccalauréat en physique, ce qui, selon lui, lui a donné les compétences de pensée critique nécessaires pour réussir dans le paysage en constante évolution d'Internet. 

Le jour de la détermination de la peine arrive : le sort de CZ est en jeu alors que le tribunal américain examine le plaidoyer du DOJ

Changpeng Zhao est sur le point d'être condamné aujourd'hui par un tribunal américain à Seattle.

En savoir plus

Les fondateurs de Samourai Wallet accusés d'avoir facilité 2 milliards de dollars de transactions sur le Darknet

L'appréhension des fondateurs de Samourai Wallet représente un revers notable pour l'industrie, soulignant la persistance...

En savoir plus
Rejoignez notre communauté technologique innovante
En savoir plus
En savoir plus
Pantera Capital investit dans la blockchain TON et exprime sa confiance dans le potentiel de Telegram pour élargir l'accessibilité de la cryptographie
La Brochure Rapport de nouvelles Technologie
Pantera Capital investit dans la blockchain TON et exprime sa confiance dans le potentiel de Telegram pour élargir l'accessibilité de la cryptographie
2 mai 2024
Mitosis lève 7 millions de dollars auprès d'Amber Group et de Foresight Ventures pour faire progresser son protocole de liquidité modulaire
La Brochure Rapport de nouvelles Technologie
Mitosis lève 7 millions de dollars auprès d'Amber Group et de Foresight Ventures pour faire progresser son protocole de liquidité modulaire
2 mai 2024
Galxe s'associe à Jambo pour étendre l'accessibilité mondiale à Web3
La Brochure Rapport de nouvelles Technologie
Galxe s'associe à Jambo pour étendre l'accessibilité mondiale à Web3
2 mai 2024
Med-Gemini de Google s'apprête à donner une longueur d'avance à GPT-4 Avec ses performances supérieures dans le domaine de la santé
AI Wiki Actualité Logiciels Technologie
Med-Gemini de Google s'apprête à donner une longueur d'avance à GPT-4 Avec ses performances supérieures dans le domaine de la santé
2 mai 2024
CRYPTOMERIA LABS PTE. LTD.