ดาวน์โหลด CenterSnap - ดาวน์โหลดซอร์สโค้ด CenterSnap

CenterSnap

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

CenterSnap: การสร้างรูปร่าง 3 มิติแบบหลายวัตถุด้วยช็อตเดียวและการประมาณท่าทางและขนาด 6 มิติตามหมวดหมู่

พื้นที่เก็บข้อมูลนี้เป็นการใช้งาน pytorch ในเอกสารของเรา:

CenterSnap: การสร้างรูปร่าง 3 มิติแบบหลายวัตถุด้วยช็อตเดียวและการประมาณท่าทางและขนาด 6 มิติตามหมวดหมู่
มูฮัมหมัด ซูแบร์ อิร์ชาด , โธมัส คอลลาร์, ไมเคิล ลาสกี้, เควิน สโตน, ซโซลต์ คิรา
การประชุมนานาชาติเรื่องหุ่นยนต์และระบบอัตโนมัติ (ICRA) ปี 2565

[หน้าโครงการ] [arXiv] [PDF] [วิดีโอ] [โปสเตอร์]

ติดตามงาน ECCV'22:

ShAPO: การแสดงโดยนัยสำหรับรูปร่างหลายวัตถุ ลักษณะที่ปรากฏ และการปรับท่าทางให้เหมาะสม
มูฮัมหมัด ซูไบร์ อิร์ชาด , เซอร์เกย์ ซาคารอฟ, ราเรส อัมบรูส, โธมัส คอลลาร์, ซโซลต์ คิรา, อาเดรียน ไกดอน
การประชุมยุโรปเรื่องคอมพิวเตอร์วิทัศน์ (ECCV) ปี 2022

[หน้าโครงการ] [arXiv] [PDF] [วิดีโอ] [โปสเตอร์]

การอ้างอิง

หากคุณพบว่าพื้นที่เก็บข้อมูลนี้มีประโยชน์ โปรดพิจารณาการอ้างอิง:

 @inproceedings{irshad2022centersnap,
     title = {CenterSnap: Single-Shot Multi-Object 3D Shape Reconstruction and Categorical 6D Pose and Size Estimation},
     author = {Muhammad Zubair Irshad and Thomas Kollar and Michael Laskey and Kevin Stone and Zsolt Kira},
     journal = {IEEE International Conference on Robotics and Automation (ICRA)},
     year = {2022}
     }


@inproceedings{irshad2022shapo,
     title = {ShAPO: Implicit Representations for Multi-Object Shape Appearance and Pose Optimization},
     author = {Muhammad Zubair Irshad and Sergey Zakharov and Rares Ambrus and Thomas Kollar and Zsolt Kira and Adrien Gaidon},
     journal = {European Conference on Computer Vision (ECCV)},
     year = {2022}
     }

สารบัญ

สิ่งแวดล้อม
ชุดข้อมูล ( อัปเดต )
การฝึกอบรมและการอนุมาน
คำถามที่พบบ่อย ( อัปเดต )
- ติดตามผลงาน ( อัพเดท )

สิ่งแวดล้อม

สร้างสภาพแวดล้อมเสมือนของ python 3.8 และข้อกำหนดในการติดตั้ง:

 cd $CenterSnap_Repo
conda create -y --prefix ./env python=3.8
conda activate ./env/
./env/bin/python -m pip install --upgrade pip
./env/bin/python -m pip install -r requirements.txt

ติดตั้ง torch==1.7.1 torchvision==0.8.2 ตามเวอร์ชัน CUDA ของคุณ รหัสถูกสร้างและทดสอบบน cuda 10.2 คำสั่งตัวอย่างในการติดตั้ง torch บน cuda 10.2 มีดังนี้:

pip install torch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2

ชุดข้อมูล

การอัปเดตใหม่ : โปรดตรวจสอบสคริปต์ที่แจกจ่ายของ ShAPO งาน ECCV'22 ใหม่ของเรา หากคุณต้องการรวบรวมข้อมูลของคุณเองตั้งแต่ต้นภายในสองสามชั่วโมง สคริปต์แบบกระจายนั้นรวบรวมข้อมูลในรูปแบบเดียวกับที่ CenterSnap กำหนด แม้ว่าจะมีการแก้ไขเล็กน้อยตามที่กล่าวไว้ใน repo นั้น

ดาวน์โหลดชุดข้อมูลที่ประมวลผลล่วงหน้า

เราขอแนะนำให้ดาวน์โหลดชุดข้อมูลที่ประมวลผลล่วงหน้าเพื่อฝึกและประเมินโมเดล CenterSnap ดาวน์โหลดและยกเลิกชุดข้อมูล Synthetic (868GB) และ Real (70GB) ไฟล์เหล่านี้ประกอบด้วยการฝึกอบรมและการตรวจสอบความถูกต้องทั้งหมดที่คุณต้องการเพื่อจำลองผลลัพธ์ของเรา

 cd $CenterSnap_REPO/data
wget https://tri-robotics-public.s3.amazonaws.com/centersnap/CAMERA.tar.gz
tar -xzvf CAMERA.tar.gz

wget https://tri-robotics-public.s3.amazonaws.com/centersnap/Real.tar.gz
tar -xzvf Real.tar.gz

โครงสร้างไดเร็กทอรีข้อมูลควรเป็นไปตาม:

 data
├── CAMERA
│   ├── train
│   └── val_subset
├── Real
│   ├── train
└── └── test

เพื่อเตรียมชุดข้อมูลของคุณเอง เราได้จัดเตรียมสคริปต์เพิ่มเติมไว้ภายใต้บาร์บีเตรียม_ดาต้า

การฝึกอบรมและการอนุมาน

ฝึกฝนบน NOCS Synthetic (ต้องใช้หน่วยความจำ GPU 13GB):

./runner.sh net_train.py @configs/net_config.txt

หมายเหตุกว่า runner.sh เทียบเท่ากับการใช้ python เพื่อรันสคริปต์ นอกจากนี้ยังตั้งค่า PYTHONPATH และ CenterSnap Enviornment Path โดยอัตโนมัติ

ปรับแต่งบน NOCS Real Train (โปรดทราบว่าสามารถรับผลลัพธ์ที่ดีได้หลังจากปรับแต่งบน Real Train เพียงไม่กี่ยุค เช่น 1-5):

./runner.sh net_train.py @configs/net_config_real_resume.txt --checkpoint p ath t o b est c heckpoint

การอนุมานบนชุดย่อยการทดสอบจริง NOCS

ดาวน์โหลดชุดย่อย NOCS Real ขนาดเล็กจาก [ที่นี่]

./runner.sh inference/inference_real.py @configs/net_config.txt --data_dir path_to_nocs_test_subset --checkpoint checkpoint_path_here

คุณควรเห็น การแสดงภาพ ที่บันทึกไว้ใน results/CenterSnap เปลี่ยน --ouput_path ใน *config.txt เพื่อบันทึกลงในโฟลเดอร์อื่น

ทางเลือก (การฝึกอบรมล่วงหน้าด้วยการเข้ารหัสอัตโนมัติรูปร่าง)

เรามีโมเดลที่ได้รับการฝึกล่วงหน้าสำหรับตัวเข้ารหัสรูปร่างอัตโนมัติเพื่อใช้สำหรับการรวบรวมและการอนุมานข้อมูล แม้ว่าโค้ดเบสของเราจะไม่จำเป็นต้องมีการฝึกตัวเข้ารหัสรูปร่างอัตโนมัติแยกต่างหาก แต่หากคุณต้องการ เราจะจัดเตรียมสคริปต์เพิ่มเติมภายใต้ external/shape_pretraining

คำถามที่พบบ่อย

1. ฉันไม่ได้รับประสิทธิภาพที่ดีจากภาพจากกล้องที่ฉันกำหนดเอง เช่น Realsense, OAK-D หรืออื่นๆ

ตอบ: เนื่องจากเครือข่ายได้รับการปรับแต่งอย่างละเอียดตามข้อมูล NOCS ในโลกแห่งความเป็นจริงเท่านั้น ในปัจจุบัน เครือข่ายที่ได้รับการฝึกอบรมล่วงหน้า จึงให้การคาดการณ์ 3D ที่ดีสำหรับการตั้งค่ากล้องต่อไปนี้ เพื่อให้ได้รับการคาดการณ์ที่ดีเกี่ยวกับพารามิเตอร์กล้องของคุณเอง ตรวจสอบให้แน่ใจว่าได้ปรับแต่งเครือข่ายด้วยชุดย่อยเล็กๆ ของคุณเอง หลังจากการฝึกอบรมล่วงหน้ากับชุดข้อมูลสังเคราะห์ เรามีสคริปต์การเตรียมข้อมูลไว้ที่นี่

2. วิธีสร้างผลลัพธ์ Zero-shot ที่ดีบนกล้องหุ่นยนต์ HSR:

ตอบ: โปรดดู คำตอบของคำถามที่พบบ่อย 1 ด้านบน เพื่อผลลัพธ์ที่ดีที่สุด ทางเลือกอื่นที่เราใช้ในการสาธิตหุ่นยนต์ HSR อย่างรวดเร็วคือการบิดเบือนการสังเกต rgb-d ที่ออกมาจากกล้องหุ่นยนต์ HSR หรือกล้องแบบกำหนดเองอื่นๆ เพื่อให้ตรงกับลักษณะที่แท้จริงของกล้องจริง NOCS (ซึ่งเราปรับแต่งโมเดลของเรา บน). วิธีนี้จะทำให้ได้ผลลัพธ์ที่ดีด้วยการปรับแต่งชุดข้อมูลจริงของ NOCS เท่านั้น โปรดดูคำตอบนี้และส่วนสำคัญที่เกี่ยวข้องที่นี่สำหรับรหัส

3. ฉัน no cuda GPUs available ขณะใช้งาน colab

คำตอบ: อย่าลืมปฏิบัติตามคำแนะนำนี้เพื่อเปิดใช้งาน GPU ใน colab:

 Make sure that you have enabled the GPU under Runtime-> Change runtime type!

4. ฉันได้รับ raise RuntimeError('received %d items of ancdata' % RuntimeError: received 0 items of ancdata

ตอบ: เพิ่ม ulimit เป็น 2048 หรือ 8096 ผ่าน uimit -n 2048

5. ฉันได้รับ RuntimeError: CUDA error: no kernel image is available for execution on the device หรือ You requested GPUs: [0] But your machine only has: []

คำตอบ: ตรวจสอบการติดตั้ง pytorch ของคุณด้วยการติดตั้ง cuda ของคุณ ลองดังต่อไปนี้:

การติดตั้ง cuda 10.2 และเรียกใช้สคริปต์เดียวกันใน Requirement.txt
การติดตั้งเวอร์ชัน pytorch cuda ที่เกี่ยวข้อง เช่น การเปลี่ยนบรรทัดนี้ใน Requirements.txt

 torch==1.7.1
torchvision==0.8.2

6. ฉันเห็นค่าเมตริก val เป็นศูนย์ใน wdb

คำตอบ: ตรวจสอบให้แน่ใจว่าคุณกำหนดเกณฑ์เมตริกไว้ เนื่องจากเมตริกการตรวจสอบความถูกต้องครั้งแรกของ pytorch lightning สูง ดูเหมือนว่าเมตริกอื่นๆ ทั้งหมดจะเป็นศูนย์ โปรดกำหนดเกณฑ์ด้วยตนเองเพื่อลบตัววัดค่าผิดปกติใน Wandb เพื่อดูตัววัดจริง

ติดตามผลงาน

งาน ECCV ติดตามผลของเรา:
- ShAPO: การแสดงโดยนัยสำหรับรูปลักษณ์ของรูปร่างหลายวัตถุและการเพิ่มประสิทธิภาพท่าทาง, ECCV, 2022
ผลงานติดตามผลอื่น ๆ (ขอชื่นชมผู้เขียนสำหรับผลงานที่ยอดเยี่ยม):
- วัตถุที่ประกบกัน: CARTO: หมวดหมู่และการสร้างวัตถุที่ประกบกันขึ้นใหม่แบบไม่เชื่อเรื่องพระเจ้าร่วมกัน, CVPR, 2023
- การจับ: การสร้างรูปร่าง 3 มิติหลายวัตถุพร้อมกันแบบเรียลไทม์พร้อมกัน การประมาณค่าท่าทาง 6DoF และการทำนายการจับหนาแน่น
- More Grasping + การทดลองในโลกแห่งความเป็นจริง: CenterGrasp: การเรียนรู้การเป็นตัวแทนโดยนัยแบบ Object-Aware สำหรับการสร้างรูปร่างใหม่พร้อมกันและการประมาณค่า Grasp 6-DoF