ニュースレポート テクノロジー
2022 年 12 月 15 日

Googleが「GPTみたいなロボットモデル「RT-1」

Google は、RT-1 という新しいロボット モデルをリリースしました。 GPT で使用されているモデル OpenAI 人工知能プログラム。 新しいモデルは、自動運転車プログラムを含むグーグルの他のロボット工学プログラムを念頭に置いて設計されている。 ここで紹介する RT-1 モデルは、ロボット工学分野における生成 AI モデルへの一歩です。 実際の世界では、RT-1 は 700% の成功率で 97 以上の命令を実行できます。

Googleがリリースした「GPTみたいなロボットモデル「RT-1」

コンピューター ビジョンや自然言語処理などの機械学習 (ML) 研究における最近の進歩は、大規模で多様なデータセットと表現力豊かなモデルを使用する共通のアプローチによって実現されています。 このアプローチをロボティクスに適用するためのさまざまな試みがありましたが、これまでのところ、ロボットは他のサブフィールドほど高性能モデルを使用していません。

このモデルは、TokenLearner を使用して圧縮する前に、事前トレーニング済みの FiLM EfficientNet モデルを使用して、記述されたコマンドと一連の画像をトークンとしてエンコードします。 これがRT-1のアーキテクチャです。 Transformer はこれらを受け取り、アクション トークンを生成します。

開発者は、新しいタスクに一般化し、さまざまな気晴らしや背景に対する堅牢性を示すことができるシステムを開発するために、ロボットの軌跡のかなり多様なデータセットを収集しました。 130 か月で 17 のエピソードを収集するために、13 台の EDR ロボット マニピュレーターを配備しました。各マニピュレーターには、7 自由度のアーム、XNUMX 本指のグリッパー、モバイル ベースが備わっています。 研究者は、遠隔遠隔操作によって得られた人間の例を使用し、ロボットが実行したばかりのコマンドの説明を記述して各イベントに印を付けました。 オブジェクトを選んで配置する、引き出しを開閉する、引き出しにオブジェクトを出し入れする、細長いオブジェクトを直立させる、オブジェクトをひっくり返す、ナプキンを引っ張る、瓶を開けるなどの高度なスキルが、データセットに含まれています。

次のビデオは、いくつかの実際のキッチンでの PaLM-SayCan-RT1 長期タスク パフォーマンスのサンプルを示しています。

1 つのすべての領域で、RT-XNUMX はベースラインよりも大幅に優れたパフォーマンスを発揮し、並外れたレベルの一般化と回復力を示しています。

RT-1 ロボティクス トランスフォーマーは、シンプルでスケーラブルな実世界のロボティクス タスク用のアクション生成モデルです。 すべての入力と出力をトークン化し、初期の言語融合とトークン学習器を備えた事前トレーニング済みの EfficientNet モデルを使用してそれらを圧縮します。 RT-1 は、何百ものタスクにわたって強力なパフォーマンスを発揮するだけでなく、実際の設定で広範な一般化と堅牢性を示します。

もっと詳しく知る:

免責事項

に沿って トラストプロジェクトのガイドライン, このページで提供される情報は、法律、税金、投資、財務、またはその他の形式のアドバイスを目的としたものではなく、そのように解釈されるべきではないことに注意してください。 損失しても許容できる金額のみを投資し、疑問がある場合は独立した財務上のアドバイスを求めることが重要です。 詳細については、利用規約のほか、発行者または広告主が提供するヘルプおよびサポート ページを参照することをお勧めします。 MetaversePost は正確で公平なレポートに努めていますが、市場の状況は予告なく変更される場合があります。

著者について

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

より多くの記事
ダミル・ヤラロフ
ダミル・ヤラロフ

Damir は、チームリーダー、プロダクトマネージャー、編集者です。 Metaverse PostAI/ML、AGI、LLM、メタバース、 Web3に関連するフィールド。 彼の記事は、毎月 10 万人を超えるユーザーという膨大な読者を魅了しています。 彼はSEOとデジタルマーケティングでXNUMX年の経験を持つ専門家のようです。 ダミールはMashable、Wired、 Cointelegraph、The New Yorker、Inside.com、Entrepreneur、BeInCrypto、およびその他の出版物。 彼はデジタル遊牧民として UAE、トルコ、ロシア、CIS の間を旅しています。 ダミールは物理学の学士号を取得しており、これにより、インターネットの絶え間なく変化する状況で成功するために必要な批判的思考スキルが身についたと信じています。 

Hot Stories

今週のトップセール、AI、IT、 Web3、および暗号化 (15-19.04)

by ヴィクトリア・パルチク
2024 年 4 月 19 日
ニュースレターにご参加ください。
最新ニュース

今週のトップセール、AI、IT、 Web3、および暗号化 (15-19.04)

by ヴィクトリア・パルチク
2024 年 4 月 19 日

DOGE の熱狂: ドージコイン (DOGE) の最近の価値の急騰を分析する

暗号通貨業界は急速に拡大しており、ミームコインは大幅な上昇に備えています。ドージコイン (DOGE)、...

詳細を知りたい

メタバースにおける AI 生成コンテンツの進化

生成 AI コンテンツの出現は、仮想環境内での最も魅力的な発展の 1 つです。

詳細を知りたい
革新的なテクノロジー コミュニティに参加してください
続きを読む
続きを読む
CertiKアラート、ヘッジファイナンスのトークン請求契約に対する進行中のサイバー攻撃を明らかに、1.9万ドルの資金が盗まれた
マーケット ニュースレポート テクノロジー
CertiKアラート、ヘッジファイナンスのトークン請求契約に対する進行中のサイバー攻撃を明らかに、1.9万ドルの資金が盗まれた
2024 年 4 月 19 日
Meson Finance がフィッシングを排除 Airdrop X サードパーティ API への投稿と属性の発行
マーケット ニュースレポート テクノロジー
Meson Finance がフィッシングを排除 Airdrop X サードパーティ API への投稿と属性の発行
2024 年 4 月 19 日
今週のトップセール、AI、IT、 Web3、および暗号化 (15-19.04)
ダイジェスト ビジネス マーケット テクノロジー
今週のトップセール、AI、IT、 Web3、および暗号化 (15-19.04)
2024 年 4 月 19 日
Avail、統合ドロップに向けて準備を整え、600 のウォレット アドレスに 354,605 億トークンを配布する計画
マーケット ニュースレポート テクノロジー
Avail、統合ドロップに向けて準備を整え、600 のウォレット アドレスに 354,605 億トークンを配布する計画
2024 年 4 月 19 日
CRYPTOMERIA LABS PTE。 株式会社。