该存储库是我们论文的 pytorch 实现:
CenterSnap:单次多对象 3D 形状重建和分类 6D 姿势和尺寸估计
穆罕默德·祖拜尔·伊沙德、托马斯·科勒、迈克尔·拉斯基、凯文·斯通、兹索尔特·基拉
国际机器人与自动化会议 (ICRA),2022 年
[项目页面] [arXiv] [PDF] [视频] [海报]
ECCV'22后续工作:
ShAPO:多对象形状、外观和姿势优化的隐式表示
穆罕默德·祖拜尔·伊沙德、谢尔盖·扎哈罗夫、拉雷斯·安布鲁斯、托马斯·科拉尔、兹索尔特·基拉、阿德里安·盖顿
欧洲计算机视觉会议 (ECCV),2022 年
[项目页面] [arXiv] [PDF] [视频] [海报]
如果您发现此存储库有用,请考虑引用:
@inproceedings{irshad2022centersnap,
title = {CenterSnap: Single-Shot Multi-Object 3D Shape Reconstruction and Categorical 6D Pose and Size Estimation},
author = {Muhammad Zubair Irshad and Thomas Kollar and Michael Laskey and Kevin Stone and Zsolt Kira},
journal = {IEEE International Conference on Robotics and Automation (ICRA)},
year = {2022}
}
@inproceedings{irshad2022shapo,
title = {ShAPO: Implicit Representations for Multi-Object Shape Appearance and Pose Optimization},
author = {Muhammad Zubair Irshad and Sergey Zakharov and Rares Ambrus and Thomas Kollar and Zsolt Kira and Adrien Gaidon},
journal = {European Conference on Computer Vision (ECCV)},
year = {2022}
}
创建python 3.8虚拟环境并安装要求:
cd $CenterSnap_Repo
conda create -y --prefix ./env python=3.8
conda activate ./env/
./env/bin/python -m pip install --upgrade pip
./env/bin/python -m pip install -r requirements.txt
根据您的 CUDA 版本安装torch==1.7.1 torchvision==0.8.2
。该代码是在cuda 10.2上构建和测试的。在 cuda 10.2 上安装 torch 的示例命令如下:
pip install torch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2
新更新:如果您想在几个小时内从头开始收集自己的数据,请查看我们新的 ECCV'22 工作ShAPO的分布式脚本。该分布式脚本以CenterSnap所需的相同格式收集数据,尽管有一些细微的修改,如该存储库中提到的。
我们建议下载预处理的数据集来训练和评估 CenterSnap 模型。下载并解压合成 (868GB) 和真实 (70GB) 数据集。这些文件包含复制我们的结果所需的所有培训和验证。
cd $CenterSnap_REPO/data
wget https://tri-robotics-public.s3.amazonaws.com/centersnap/CAMERA.tar.gz
tar -xzvf CAMERA.tar.gz
wget https://tri-robotics-public.s3.amazonaws.com/centersnap/Real.tar.gz
tar -xzvf Real.tar.gz
数据目录结构应遵循:
data
├── CAMERA
│ ├── train
│ └── val_subset
├── Real
│ ├── train
└── └── test
./runner.sh net_train.py @configs/net_config.txt
注意runner.sh相当于使用python运行脚本。此外,它还会自动设置 PYTHONPATH 和 CenterSnap Enviornment Path。
./runner.sh net_train.py @configs/net_config_real_resume.txt --checkpoint p ath t o b est c heckpoint
从 [此处] 下载一个小的 NOCS Real 子集
./runner.sh inference/inference_real.py @configs/net_config.txt --data_dir path_to_nocs_test_subset --checkpoint checkpoint_path_here
您应该看到保存在results/CenterSnap
中的可视化效果。更改 *config.txt 中的 --ouput_path 将它们保存到不同的文件夹
我们为形状自动编码器提供预训练模型,用于数据收集和推理。尽管我们的代码库不需要单独训练形状自动编码器,但如果您愿意,我们可以在external/shape_pretraining下提供其他脚本
1.我在自定义相机图像(即 Realsense、OAK-D 或其他图像)上没有获得良好的性能。
2.如何在HSR机器人相机上产生良好的零镜头结果:
3.运行 colab 时,我no cuda GPUs available
。
Make sure that you have enabled the GPU under Runtime-> Change runtime type!
4.我收到raise RuntimeError('received %d items of ancdata' % RuntimeError: received 0 items of ancdata
uimit -n 2048
将 ulimit 增加到 2048 或 8096 5.我收到RuntimeError: CUDA error: no kernel image is available for execution on the device
或You requested GPUs: [0] But your machine only has: []
安装cuda 10.2并在requirements.txt中运行相同的脚本
安装相关的pytorch cuda版本,即更改requirements.txt中的这一行
torch==1.7.1
torchvision==0.8.2
6.我在wandb中看到零值指标
我们的后续ECCV工作:
其他后续作品(向作者的出色工作致敬):