RT X 다운로드 - RT X 소스 코드 다운로드

RT X

AI 소스 코드

1.0.0

다운로드

다중 양식

RT-X

"Open X-Embodiment: Robotic Learning Datasets and RT-X Models" 논문에서 RT-1-X 및 RT-2-X 모델의 Pytorch 구현.

여기서는 RTX-1과 RTX-2 모델 아키텍처를 모두 구현합니다.

종이 링크

RTX-2 구현은 기본적으로 단순화를 위해 7차원 벡터를 출력하지 않고 텍스트 토큰을 출력합니다. 7차원 벡터를 출력하려면 RTX1에서와 동일한 토큰 학습기를 구현할 수 있습니다.

감사

루시드레인
아고리안

설치하다

pip install rtx-torch

용법

자세한 사용법을 보려면 python run.py --help 실행하세요.

RTX1

RTX1 사용법에는 텍스트와 비디오가 필요합니다.
아직 Efficient Net을 사용하지 않습니다. 지금 통합 중이며 구현이 완료됩니다.
SOTA 변환기 아키텍처 사용

 import torch
from rtx . rtx1 import RTX1 , FilmViTConfig

# Use a pre-trained MaxVit model from pytorch
model = RTX1 ( film_vit_config = FilmViTConfig ( pretrained = pretrained ))

video = torch . randn ( 2 , 3 , 6 , 224 , 224 )

instructions = [ "bring me that apple sitting on the table" , "please pass the butter" ]

# compute the train logits
train_logits = model . train ( video , instructions )

# set the model to evaluation mode
model . model . eval ()

# compute the eval logits with a conditional scale of 3
eval_logits = model . run ( video , instructions , cond_scale = 3.0 )
print ( eval_logits . shape )

RTX-2

RTX-2는 이미지와 텍스트를 가져와 인터리브하여 다중 모드 문장을 형성하고 x,y,z,roll,pitch,yaw 및 그리퍼의 7차원 벡터가 아닌 텍스트 토큰을 출력합니다.

 import torch
from rtx import RTX2

# usage
img = torch . randn ( 1 , 3 , 256 , 256 )
text = torch . randint ( 0 , 20000 , ( 1 , 1024 ))

model = RTX2 ()
output = model ( img , text )
print ( output )

EfficientNetFilm

주어진 이미지에서 특징을 추출합니다.

 from rtx import EfficientNetFilm

model = EfficientNetFilm ( "efficientnet-b0" , 10 )

out = model ( "img.jpeg" )

종이 구현과 모델의 차이점

RT-1

여기서 주요 차이점은 Film-EfficientNet 백본(필름 레이어가 삽입된 사전 훈련된 EfficientNet-B3)을 MaxViT 모델로 대체한다는 것입니다.

테스트

pytest를 사용하여 모든 모듈(RTX1, RTX2, EfficientNetFil)에 대해 테스트를 실행하는 단일 테스트 파일을 만들었습니다. 먼저 git clone을 하고 저장소에 들어가서 pip로 요구 사항.txt를 설치한 후 다음을 실행합니다.

python -m pytest tests/tests.py

특허

MIT

인용

 @misc { open_x_embodiment_rt_x_2023 ,
title = { Open {X-E}mbodiment: Robotic Learning Datasets and {RT-X} Models } ,
author = {Open X-Embodiment Collaboration and Abhishek Padalkar and Acorn Pooley and Ajinkya Jain and Alex Bewley and Alex Herzog and Alex Irpan and Alexander Khazatsky and Anant Rai and Anikait Singh and Anthony Brohan and Antonin Raffin and Ayzaan Wahid and Ben Burgess-Limerick and Beomjoon Kim and Bernhard Schölkopf and Brian Ichter and Cewu Lu and Charles Xu and Chelsea Finn and Chenfeng Xu and Cheng Chi and Chenguang Huang and Christine Chan and Chuer Pan and Chuyuan Fu and Coline Devin and Danny Driess and Deepak Pathak and Dhruv Shah and Dieter Büchler and Dmitry Kalashnikov and Dorsa Sadigh and Edward Johns and Federico Ceola and Fei Xia and Freek Stulp and Gaoyue Zhou and Gaurav S. Sukhatme and Gautam Salhotra and Ge Yan and Giulio Schiavi and Hao Su and Hao-Shu Fang and Haochen Shi and Heni Ben Amor and Henrik I Christensen and Hiroki Furuta and Homer Walke and Hongjie Fang and Igor Mordatch and Ilija Radosavovic and Isabel Leal and Jacky Liang and Jaehyung Kim and Jan Schneider and Jasmine Hsu and Jeannette Bohg and Jeffrey Bingham and Jiajun Wu and Jialin Wu and Jianlan Luo and Jiayuan Gu and Jie Tan and Jihoon Oh and Jitendra Malik and Jonathan Tompson and Jonathan Yang and Joseph J. Lim and João Silvério and Junhyek Han and Kanishka Rao and Karl Pertsch and Karol Hausman and Keegan Go and Keerthana Gopalakrishnan and Ken Goldberg and Kendra Byrne and Kenneth Oslund and Kento Kawaharazuka and Kevin Zhang and Keyvan Majd and Krishan Rana and Krishnan Srinivasan and Lawrence Yunliang Chen and Lerrel Pinto and Liam Tan and Lionel Ott and Lisa Lee and Masayoshi Tomizuka and Maximilian Du and Michael Ahn and Mingtong Zhang and Mingyu Ding and Mohan Kumar Srirama and Mohit Sharma and Moo Jin Kim and Naoaki Kanazawa and Nicklas Hansen and Nicolas Heess and Nikhil J Joshi and Niko Suenderhauf and Norman Di Palo and Nur Muhammad Mahi Shafiullah and Oier Mees and Oliver Kroemer and Pannag R Sanketi and Paul Wohlhart and Peng Xu and Pierre Sermanet and Priya Sundaresan and Quan Vuong and Rafael Rafailov and Ran Tian and Ria Doshi and Roberto Martín-Martín and Russell Mendonca and Rutav Shah and Ryan Hoque and Ryan Julian and Samuel Bustamante and Sean Kirmani and Sergey Levine and Sherry Moore and Shikhar Bahl and Shivin Dass and Shuran Song and Sichun Xu and Siddhant Haldar and Simeon Adebola and Simon Guist and Soroush Nasiriany and Stefan Schaal and Stefan Welker and Stephen Tian and Sudeep Dasari and Suneel Belkhale and Takayuki Osa and Tatsuya Harada and Tatsuya Matsushima and Ted Xiao and Tianhe Yu and Tianli Ding and Todor Davchev and Tony Z. Zhao and Travis Armstrong and Trevor Darrell and Vidhi Jain and Vincent Vanhoucke and Wei Zhan and Wenxuan Zhou and Wolfram Burgard and Xi Chen and Xiaolong Wang and Xinghao Zhu and Xuanlin Li and Yao Lu and Yevgen Chebotar and Yifan Zhou and Yifeng Zhu and Ying Xu and Yixuan Wang and Yonatan Bisk and Yoonyoung Cho and Youngwoon Lee and Yuchen Cui and Yueh-hua Wu and Yujin Tang and Yuke Zhu and Yunzhu Li and Yusuke Iwasawa and Yutaka Matsuo and Zhuo Xu and Zichen Jeff Cui},
howpublished  = { url{https://arxiv.org/abs/2310.08864} } ,
year = { 2023 } ,
}