Unduhan CenterSnap - Unduhan kode sumber CenterSnap

CenterSnap

Kode Sumber AI

1.0.0

Unduh

CenterSnap: Rekonstruksi Bentuk 3D Multi-Objek Bidikan Tunggal dan Pose 6D Kategoris serta Estimasi Ukuran

Repositori ini adalah implementasi pytorch dari makalah kami:

CenterSnap: Rekonstruksi Bentuk 3D Multi-Objek Bidikan Tunggal dan Pose 6D Kategoris serta Estimasi Ukuran
Muhammad Zubair Irshad , Thomas Kollar, Michael Laskey, Kevin Stone, Zsolt Kira
Konferensi Internasional tentang Robotika dan Otomasi (ICRA), 2022

[Halaman Proyek] [arXiv] [PDF] [Video] [Poster]

Pekerjaan lanjutan ECCV'22:

ShAPO: Representasi Implisit untuk Bentuk, Penampilan, dan Optimasi Pose Multi-Objek
Muhammad Zubair Irshad , Sergey Zakharov, Rares Ambrus, Thomas Kollar, Zsolt Kira, Adrien Gaidon
Konferensi Eropa tentang Visi Komputer (ECCV), 2022

[Halaman Proyek] [arXiv] [PDF] [Video] [Poster]

Kutipan

Jika Anda merasa repositori ini berguna, mohon pertimbangkan untuk mengutip:

 @inproceedings{irshad2022centersnap,
     title = {CenterSnap: Single-Shot Multi-Object 3D Shape Reconstruction and Categorical 6D Pose and Size Estimation},
     author = {Muhammad Zubair Irshad and Thomas Kollar and Michael Laskey and Kevin Stone and Zsolt Kira},
     journal = {IEEE International Conference on Robotics and Automation (ICRA)},
     year = {2022}
     }


@inproceedings{irshad2022shapo,
     title = {ShAPO: Implicit Representations for Multi-Object Shape Appearance and Pose Optimization},
     author = {Muhammad Zubair Irshad and Sergey Zakharov and Rares Ambrus and Thomas Kollar and Zsolt Kira and Adrien Gaidon},
     journal = {European Conference on Computer Vision (ECCV)},
     year = {2022}
     }

Isi

Lingkungan
Kumpulan Data ( Diperbarui )
Pelatihan dan Inferensi
Pertanyaan Umum ( Diperbarui )
? Pekerjaan tindak lanjut ( Diperbarui )

Lingkungan

Buat lingkungan virtual python 3.8 dan instal persyaratan:

 cd $CenterSnap_Repo
conda create -y --prefix ./env python=3.8
conda activate ./env/
./env/bin/python -m pip install --upgrade pip
./env/bin/python -m pip install -r requirements.txt

Instal torch==1.7.1 torchvision==0.8.2 berdasarkan versi CUDA Anda. Kode ini dibuat dan diuji pada cuda 10.2 . Contoh perintah untuk menginstal torch di cuda 10.2 adalah sebagai berikut:

pip install torch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2

Kumpulan data

Pembaruan Baru : Silakan periksa skrip terdistribusi dari ShAPO karya ECCV'22 kami yang baru jika Anda ingin mengumpulkan data Anda sendiri dari awal dalam beberapa jam. Skrip terdistribusi tersebut mengumpulkan data dalam format yang sama seperti yang disyaratkan oleh CenterSnap , meskipun dengan sedikit modifikasi seperti yang disebutkan dalam repo tersebut.

Unduh kumpulan data yang telah diproses sebelumnya

Kami merekomendasikan mengunduh kumpulan data yang telah diproses sebelumnya untuk melatih dan mengevaluasi model CenterSnap. Unduh dan untar kumpulan data Sintetis (868 GB) dan Nyata (70 GB). File-file ini berisi semua pelatihan dan validasi yang Anda perlukan untuk mereplikasi hasil kami.

 cd $CenterSnap_REPO/data
wget https://tri-robotics-public.s3.amazonaws.com/centersnap/CAMERA.tar.gz
tar -xzvf CAMERA.tar.gz

wget https://tri-robotics-public.s3.amazonaws.com/centersnap/Real.tar.gz
tar -xzvf Real.tar.gz

Struktur direktori data harus mengikuti:

 data
├── CAMERA
│   ├── train
│   └── val_subset
├── Real
│   ├── train
└── └── test

Untuk menyiapkan kumpulan data Anda sendiri, kami menyediakan skrip tambahan di bawah persiapan_data.

Pelatihan dan Inferensi

Berlatih di NOCS Synthetic (membutuhkan memori GPU 13GB):

./runner.sh net_train.py @configs/net_config.txt

Catatan bahwa runner.sh sama dengan menggunakan python untuk menjalankan skrip. Selain itu, ini mengatur Jalur Lingkungan PYTHONPATH dan CenterSnap secara otomatis.

Penyempurnaan pada Kereta Nyata NOCS (Perhatikan bahwa hasil yang baik dapat diperoleh setelah penyempurnaan pada set kereta Nyata hanya untuk beberapa epoch yaitu 1-5):

./runner.sh net_train.py @configs/net_config_real_resume.txt --checkpoint p ath t o b est c heckpoint

Inferensi pada Subset Uji Nyata NOCS

Unduh subset kecil NOCS Real dari [di sini]

./runner.sh inference/inference_real.py @configs/net_config.txt --data_dir path_to_nocs_test_subset --checkpoint checkpoint_path_here

Anda akan melihat visualisasi yang disimpan di results/CenterSnap . Ubah --ouput_path di *config.txt untuk menyimpannya ke folder lain

Opsional (Pra-pelatihan Bentuk Auto-Encoder)

Kami menyediakan model terlatih untuk pembuat enkode otomatis bentuk yang akan digunakan dalam pengumpulan dan inferensi data. Meskipun basis kode kami tidak memerlukan pelatihan pembuat enkode otomatis bentuk secara terpisah, jika Anda ingin melakukannya, kami menyediakan skrip tambahan di bawah external/shape_pretraining

Pertanyaan Umum

1. Saya tidak mendapatkan performa yang baik pada gambar kamera khusus saya, misalnya Realsense, OAK-D, atau lainnya.

Jawab: Karena jaringan disempurnakan hanya pada data NOCS dunia nyata, saat ini jaringan yang telah dilatih sebelumnya memberikan prediksi 3D yang baik untuk pengaturan kamera berikut. Untuk mendapatkan prediksi yang baik pada parameter kamera Anda, pastikan untuk menyempurnakan jaringan dengan subset kecil Anda sendiri setelah pra-pelatihan tentang kumpulan data sintetis. Kami menyediakan skrip persiapan data di sini.

2. Cara menghasilkan hasil zero-shot yang bagus pada kamera robot HSR:

Jawab: Silakan lihat jawaban FAQ1 di atas untuk hasil terbaik. Solusi alternatif yang kami gunakan untuk melakukan demo cepat pada robot HSR adalah dengan membengkokkan pengamatan rgb-d yang keluar dari kamera robot HSR atau kamera khusus lainnya sehingga cocok dengan intrinsik kamera nyata NOCS (yang kami sempurnakan model kami pada). Dengan cara ini seseorang bisa mendapatkan hasil yang layak hanya dengan menyempurnakan dataset nyata NOCS. Silakan lihat jawaban ini dan inti terkait di sini untuk kodenya.

3. Saya no cuda GPUs available saat menjalankan colab.

Jawab: Pastikan untuk mengikuti instruksi ini untuk mengaktifkan GPU di colab:

 Make sure that you have enabled the GPU under Runtime-> Change runtime type!

4. Saya mendapat raise RuntimeError('received %d items of ancdata' % RuntimeError: received 0 items of ancdata

Jawab: Tingkatkan ulimit menjadi 2048 atau 8096 melalui uimit -n 2048

5. Saya mendapatkan RuntimeError: CUDA error: no kernel image is available for execution on the device atau You requested GPUs: [0] But your machine only has: []

Jawab: Periksa instalasi pytorch Anda dengan instalasi cuda Anda. Coba yang berikut ini:

Menginstal cuda 10.2 dan menjalankan skrip yang sama di persyaratan.txt
Menginstal versi pytorch cuda yang relevan yaitu mengubah baris ini di persyaratan.txt

 torch==1.7.1
torchvision==0.8.2

6. Saya melihat metrik val nol di tongkat sihir

Jawab: Pastikan Anda membatasi metriknya. Karena metrik pemeriksaan validasi pertama pytorch Lightning tinggi, sepertinya semua metrik lainnya nol. Harap ambang batas secara manual untuk menghapus metrik outlier di tongkat sihir untuk melihat metrik sebenarnya.

Pekerjaan tindak lanjut

Pekerjaan ECCV tindak lanjut kami:
- ShAPO: Representasi Implisit untuk Penampilan Bentuk Multi Objek dan Optimasi Pose, ECCV, 2022
Karya lanjutan lainnya (Berteriaklah kepada penulis atas karya hebatnya):
- Objek Artikulasi: CARTO: Kategori dan Rekonstruksi Agnostik Gabungan Objek Artikulasi, CVPR, 2023
- Pemahaman: Rekonstruksi Bentuk 3D Multi-Objek Secara Simultan, Estimasi Pose 6DoF, dan Prediksi Pemahaman Padat
- Eksperimen yang Lebih Menggenggam + di dunia nyata: CenterGrasp: Pembelajaran Representasi Implisit Sadar Objek untuk Rekonstruksi Bentuk Simultan dan Estimasi Genggaman 6-DoF