Nachrichtenbericht Technologie
15. Dezember 2022

Google veröffentlicht ein „GPT-ähnliches“ Robotermodell, der RT-1

Google hat ein neues Robotermodell veröffentlicht, den RT-1, der dem ähnelt GPT Modell, das in seinem verwendet wird OpenAI Programm für künstliche Intelligenz. Das neue Modell wurde unter Berücksichtigung der anderen Robotikprogramme von Google entwickelt, darunter auch das Programm für selbstfahrende Autos. Das hier vorgestellte RT-1-Modell ist ein Schritt hin zu generativen KI-Modellen im Bereich der Robotik. In der realen Welt kann der RT-1 über 700 Anweisungen mit einer Erfolgsquote von 97 % ausführen.

Google veröffentlicht ein „GPT-ähnliches" Robotermodell, der RT-1

Die jüngsten Fortschritte in der Forschung zum maschinellen Lernen (ML), wie Computer Vision und Verarbeitung natürlicher Sprache, wurden durch einen gemeinsamen Ansatz ermöglicht, der große, vielfältige Datensätze und ausdrucksstarke Modelle verwendet. Obwohl es verschiedene Versuche gegeben hat, diesen Ansatz auf die Robotik anzuwenden, haben Roboter bisher nicht so viele hochleistungsfähige Modelle verwendet wie andere Teilgebiete.

Das Modell codiert einen schriftlichen Befehl und eine Reihe von Bildern als Token unter Verwendung eines vortrainierten FiLM EfficientNet-Modells, bevor es mit TokenLearner komprimiert wird. Dies ist die Architektur von RT-1. Der Transformer erhält diese dann und produziert Aktionsmarken.

Die Entwickler sammelten einen umfangreichen, vielfältigen Datensatz von Robotertrajektorien, um ein System zu entwickeln, das für neue Aufgaben verallgemeinert werden konnte und Robustheit gegenüber verschiedenen Ablenkungen und Hintergründen demonstrierte. Um 130 Episoden über 17 Monate zu sammeln, setzten sie 13 EDR-Robotermanipulatoren ein, von denen jeder einen Arm mit 7 Freiheitsgraden, einen Zwei-Finger-Greifer und eine mobile Basis hat. Die Forscher verwendeten menschliche Beispiele, die durch Fernteleoperation erhalten wurden, und markierten jedes Ereignis mit einer schriftlichen Erklärung des Befehls, den der Roboter gerade ausgeführt hatte. Das Aufnehmen und Ordnen von Gegenständen, das Öffnen und Schließen von Schubladen, das Einlegen und Herausnehmen von Gegenständen aus Schubladen, das Aufrichten länglicher Gegenstände, das Umwerfen von Gegenständen, das Ziehen von Servietten und das Öffnen von Gläsern gehören zu den im Datensatz enthaltenen High-Level-Fähigkeiten.

Das folgende Video zeigt einige beispielhafte PaLM-SayCan-RT1-Long-Horizon-Aufgabenleistungen in mehreren tatsächlichen Küchen.

In allen vier Bereichen schneidet RT-1 deutlich besser ab als die Basislinien und zeigt ein außergewöhnliches Maß an Generalisierung und Widerstandsfähigkeit.

Der RT-1 Robotics Transformer ist ein einfaches und skalierbares Action-Generation-Modell für reale Robotikaufgaben. Es tokenisiert alle Eingaben und Ausgaben und komprimiert sie mithilfe eines vortrainierten EfficientNet-Modells mit früher Sprachfusion und einem Token-Lerner. RT-1 zeigt eine starke Leistung bei Hunderten von Aufgaben sowie eine umfassende Verallgemeinerung und Robustheit in realen Umgebungen.

Mehr erfahren:

Haftungsausschluss

Im Einklang mit der Richtlinien des Trust-ProjektsBitte beachten Sie, dass die auf dieser Seite bereitgestellten Informationen nicht als Rechts-, Steuer-, Anlage-, Finanz- oder sonstige Beratung gedacht sind und nicht als solche interpretiert werden sollten. Es ist wichtig, nur so viel zu investieren, wie Sie sich leisten können, zu verlieren, und im Zweifelsfall eine unabhängige Finanzberatung einzuholen. Für weitere Informationen empfehlen wir einen Blick auf die Allgemeinen Geschäftsbedingungen sowie die Hilfe- und Supportseiten des Herausgebers oder Werbetreibenden. MetaversePost ist einer genauen, unvoreingenommenen Berichterstattung verpflichtet, die Marktbedingungen können sich jedoch ohne Vorankündigung ändern.

Über den Autor

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Weitere Artikel
Damir Jalalow
Damir Jalalow

Damir ist Teamleiter, Produktmanager und Redakteur bei Metaverse Post, behandelt Themen wie KI/ML, AGI, LLMs, Metaverse und Web3-bezogene Felder. Seine Artikel ziehen jeden Monat ein riesiges Publikum von über einer Million Nutzern an. Er scheint ein Experte mit 10 Jahren Erfahrung in SEO und digitalem Marketing zu sein. Damir wurde in Mashable, Wired, Cointelegraph, The New Yorker, Inside.com, Entrepreneur, BeInCrypto und andere Publikationen. Als digitaler Nomade reist er zwischen den Vereinigten Arabischen Emiraten, der Türkei, Russland und der GUS. Damir hat einen Bachelor-Abschluss in Physik, der ihm seiner Meinung nach die Fähigkeiten zum kritischen Denken vermittelt hat, die er braucht, um in der sich ständig verändernden Landschaft des Internets erfolgreich zu sein. 

Hot Stories
Abonnieren Sie unseren Newsletter.
Aktuelles

Der Tag der Verurteilung steht vor der Tür: Das Schicksal von CZ bleibt ungewiss, während das US-Gericht den Plädoyer des DOJ prüft

Changpeng Zhao steht heute vor einer Verurteilung vor einem US-Gericht in Seattle.

Weitere Informationen

Den Gründern von Samourai Wallet wird vorgeworfen, Darknet-Deals im Wert von 2 Milliarden US-Dollar ermöglicht zu haben

Die Besorgnis der Samourai Wallet-Gründer stellt einen bemerkenswerten Rückschlag für die Branche dar und unterstreicht die anhaltende ...

Weitere Informationen
Treten Sie unserer innovativen Tech-Community bei
Weiterlesen
Lesen Sie weiter
Pantera Capital investiert in die TON-Blockchain und zeigt sich zuversichtlich, dass Telegram das Potenzial hat, die Zugänglichkeit von Kryptowährungen zu erweitern
Geschäft Nachrichtenbericht Technologie
Pantera Capital investiert in die TON-Blockchain und zeigt sich zuversichtlich, dass Telegram das Potenzial hat, die Zugänglichkeit von Kryptowährungen zu erweitern
2. Mai 2024
Mitosis erhält 7 Millionen US-Dollar an Finanzmitteln von der Amber Group und Foresight Ventures, um sein modulares Liquiditätsprotokoll voranzutreiben
Geschäft Nachrichtenbericht Technologie
Mitosis erhält 7 Millionen US-Dollar an Finanzmitteln von der Amber Group und Foresight Ventures, um sein modulares Liquiditätsprotokoll voranzutreiben
2. Mai 2024
Galxe arbeitet mit Jambo zusammen, um die globale Zugänglichkeit zu erweitern Web3
Geschäft Nachrichtenbericht Technologie
Galxe arbeitet mit Jambo zusammen, um die globale Zugänglichkeit zu erweitern Web3
2. Mai 2024
Googles Med-Gemini ist bereit, einen Vorsprung zu verschaffen GPT-4 Mit seiner überlegenen Leistung im Gesundheitswesen
AI Wiki Aktuelles Software Technologie
Googles Med-Gemini ist bereit, einen Vorsprung zu verschaffen GPT-4 Mit seiner überlegenen Leistung im Gesundheitswesen
2. Mai 2024