CenterSnap 다운로드 - CenterSnap 소스 코드 다운로드

CenterSnap

AI 소스 코드

1.0.0

다운로드

CenterSnap: 단일 샷 다중 객체 3D 형상 재구성 및 범주형 6D 포즈 및 크기 추정

이 저장소는 우리 논문의 pytorch 구현입니다.

CenterSnap: 단일 샷 다중 객체 3D 형상 재구성 및 범주형 6D 포즈 및 크기 추정
무하마드 주바이르 이르샤드 , 토마스 콜라, 마이클 라스키, 케빈 스톤, 졸트 키라
2022년 ICRA(로봇공학 및 자동화에 관한 국제 회의)

[프로젝트 페이지] [arXiv] [PDF] [동영상] [포스터]

후속 ECCV'22 작업:

ShAPO: 다중 객체 모양, 모양 및 포즈 최적화를 위한 암시적 표현
무하마드 주바이르 이르샤드 , 세르게이 자카로프, 라레스 암브루스, 토마스 콜라, 졸트 키라, 아드리앙 가이돈
컴퓨터 비전에 관한 유럽 회의(ECCV), 2022

[프로젝트 페이지] [arXiv] [PDF] [동영상] [포스터]

소환

이 저장소가 유용하다고 생각되면 다음을 인용해 보세요.

 @inproceedings{irshad2022centersnap,
     title = {CenterSnap: Single-Shot Multi-Object 3D Shape Reconstruction and Categorical 6D Pose and Size Estimation},
     author = {Muhammad Zubair Irshad and Thomas Kollar and Michael Laskey and Kevin Stone and Zsolt Kira},
     journal = {IEEE International Conference on Robotics and Automation (ICRA)},
     year = {2022}
     }


@inproceedings{irshad2022shapo,
     title = {ShAPO: Implicit Representations for Multi-Object Shape Appearance and Pose Optimization},
     author = {Muhammad Zubair Irshad and Sergey Zakharov and Rares Ambrus and Thomas Kollar and Zsolt Kira and Adrien Gaidon},
     journal = {European Conference on Computer Vision (ECCV)},
     year = {2022}
     }

내용물

환경
데이터세트( 업데이트됨 )
훈련과 추론
FAQ( 업데이트됨 )
? 후속작 ( 업데이트 )

환경

Python 3.8 가상 환경을 만들고 요구 사항을 설치합니다.

 cd $CenterSnap_Repo
conda create -y --prefix ./env python=3.8
conda activate ./env/
./env/bin/python -m pip install --upgrade pip
./env/bin/python -m pip install -r requirements.txt

CUDA 버전에 따라 torch==1.7.1 torchvision==0.8.2 설치하세요. 코드는 cuda 10.2 에서 빌드되고 테스트되었습니다. cuda 10.2에 torch를 설치하는 샘플 명령은 다음과 같습니다:

pip install torch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2

데이터세트

새로운 업데이트 : 몇 시간 안에 처음부터 자신의 데이터를 수집하려면 새로운 ECCV'22 작업 ShAPO 의 분산 스크립트를 확인하세요. 해당 분산 스크립트는 CenterSnap 에서 요구하는 것과 동일한 형식으로 데이터를 수집합니다. 단, 해당 저장소에 언급된 대로 몇 가지 사소한 수정이 필요합니다.

사전 처리된 데이터 세트 다운로드

CenterSnap 모델을 훈련하고 평가하려면 사전 처리된 데이터 세트를 다운로드하는 것이 좋습니다. 합성(868GB) 및 실제(70GB) 데이터세트를 다운로드하고 압축을 해제하세요. 이 파일에는 결과를 복제하는 데 필요한 모든 교육 및 검증이 포함되어 있습니다.

 cd $CenterSnap_REPO/data
wget https://tri-robotics-public.s3.amazonaws.com/centersnap/CAMERA.tar.gz
tar -xzvf CAMERA.tar.gz

wget https://tri-robotics-public.s3.amazonaws.com/centersnap/Real.tar.gz
tar -xzvf Real.tar.gz

데이터 디렉터리 구조는 다음과 같아야 합니다.

 data
├── CAMERA
│   ├── train
│   └── val_subset
├── Real
│   ├── train
└── └── test

자체 데이터 세트를 준비하기 위해 prepare_data 아래에 추가 스크립트를 제공합니다.

훈련과 추론

NOCS Synthetic에서 훈련(13GB GPU 메모리 필요):

./runner.sh net_train.py @configs/net_config.txt

runner.sh는 Python을 사용하여 스크립트를 실행하는 것과 동일합니다. 또한 PYTHONPATH 및 CenterSnap 환경 경로를 자동으로 설정합니다.

NOCS 실제 열차에 대한 미세 조정(실제 열차 세트에서 단 몇 epoch, 즉 1-5에 대한 미세 조정 후에 좋은 결과를 얻을 수 있습니다):

./runner.sh net_train.py @configs/net_config_real_resume.txt --checkpoint p ath t o b est c heckpoint

NOCS 실제 테스트 하위 집합에 대한 추론

[여기]에서 작은 NOCS Real 하위 집합을 다운로드하세요.

./runner.sh inference/inference_real.py @configs/net_config.txt --data_dir path_to_nocs_test_subset --checkpoint checkpoint_path_here

results/CenterSnap 에 저장된 시각화가 표시되어야 합니다. *config.txt에서 --ouput_path를 변경하여 다른 폴더에 저장하세요.

선택사항(형상 자동 인코더 사전 훈련)

데이터 수집 및 추론에 사용될 형상 자동 인코더에 대한 사전 훈련된 모델을 제공합니다. 우리 코드베이스에서는 모양 자동 인코더를 별도로 훈련할 필요가 없지만 그렇게 하려는 경우 external/shape_pretraining 아래에 추가 스크립트를 제공합니다.

FAQ

1. Realsense, OAK-D 또는 기타 사용자 정의 카메라 이미지에서 좋은 성능을 얻지 못합니다.

답변: 네트워크는 실제 NOCS 데이터에만 미세 조정되었으므로 현재 사전 훈련된 네트워크는 다음 카메라 설정에 대해 우수한 3D 예측을 제공합니다. 자신의 카메라 매개변수에 대해 좋은 예측을 얻으려면 합성 데이터 세트에 대한 사전 훈련을 마친 후 자신의 작은 하위 집합으로 네트워크를 미세 조정해야 합니다. 여기서는 데이터 준비 스크립트를 제공합니다.

2. HSR 로봇 카메라에서 좋은 제로샷 결과를 생성하는 방법:

답변: 최상의 결과를 얻으려면 위의 FAQ1에 대한 답변을 참조하세요. HSR 로봇에 대한 빠른 데모를 수행하기 위해 채택한 대체 솔루션은 HSR 로봇 카메라 또는 기타 맞춤형 카메라에서 나오는 rgb-d 관찰을 NOCS 실제 카메라의 내장 기능과 일치하도록 왜곡하는 것입니다(모델을 미세 조정함). 에). 이렇게 하면 NOCS 실제 데이터 세트를 미세 조정하는 것만으로 괜찮은 결과를 얻을 수 있습니다. 코드에 대해서는 이 답변과 해당 요지를 여기에서 참조하세요.

3. Colab을 실행하는 동안 no cuda GPUs available .

답변: Colab에서 GPU를 활성화하려면 다음 지침을 따르세요.

 Make sure that you have enabled the GPU under Runtime-> Change runtime type!

4. raise RuntimeError('received %d items of ancdata' % RuntimeError: received 0 items of ancdata

답변: uimit -n 2048 통해 ulimit를 2048 또는 8096으로 늘립니다.

5. RuntimeError: CUDA error: no kernel image is available for execution on the device You requested GPUs: [0] But your machine only has: []

답변: cuda 설치로 pytorch 설치를 확인하세요. 다음을 시도해 보세요:

cuda 10.2 설치 및 요구사항.txt에서 동일한 스크립트 실행
관련 Pytorch cuda 버전 설치, 즉 요구사항.txt에서 이 줄 변경

 torch==1.7.1
torchvision==0.8.2

6. wandb 에 값이 0인 메트릭이 표시됩니다.

답변: 측정항목의 임계값을 설정했는지 확인하세요. Pytorch Lightning의 첫 번째 유효성 검사 지표가 높기 때문에 다른 모든 지표는 0인 것처럼 보입니다. 실제 측정항목을 보려면 wandb에서 이상값 측정항목을 제거하려면 임계값을 수동으로 설정하세요.

후속작

후속 ECCV 작업:
- ShAPO: 다중 객체 모양 모양 및 포즈 최적화를 위한 암시적 표현, ECCV, 2022
기타 후속 작품(훌륭한 작품을 만든 작가에게 감사 인사):
- 관절 객체: CARTO: 관절 객체의 카테고리 및 공동 불가지론적 재구성, CVPR, 2023
- 파악: 실시간 동시 다중 객체 3D 형상 재구성, 6DoF 자세 추정 및 밀도 파악 예측
- 추가 파악 + 실제 실험: CenterGrasp: 동시 형상 재구성 및 6-DoF 파악 추정을 위한 객체 인식 암시적 표현 학습