Implementasi PyTorch dari makalah kami:
Berkorelasi dan Menggembirakan: Pencocokan Stereo Waktu Nyata melalui Eksitasi Volume Biaya Terpandu
Penulis: Antyanta Bangunharcana 1 , Jae Won Cho 2 , Seokju Lee 2 , In So Kweon 2 , Kyung-Soo Kim 1 , Soohyun Kim 1
1 Lab MSC, 2 Lab RVC, Institut Sains dan Teknologi Lanjutan Korea (KAIST)
Konferensi Internasional IEEE/RSJ tentang Robot dan Sistem Cerdas (IROS), 2021
[Halaman proyek] | [Kertas]
Kami mengusulkan Eksitasi Volume Biaya Terpandu (GCE) dan regresi disparitas soft-argmax top-k untuk pencocokan stereo waktu nyata dan akurat.
Kami merekomendasikan penggunaan conda untuk instalasi:
conda env create -f environment.yml
conda activate coex
Bobot SceneFlow terlatih kami dapat diunduh melalui tautan berikut:
Model kami mencapai EPE SceneFlow (End-Point-Error) baru sebesar 0,596, lebih baik dari EPE sebelumnya sebesar 0,69 yang dilaporkan di makalah asli.
Untuk demo kode kami pada kumpulan data KITTI, unduh "[data yang disinkronkan+diperbaiki]" dari data mentah KITTI. Buka zip dan letakkan folder yang diekstrak mengikuti pohon direktori di bawah.
Kumpulan data alur pemandangan
Unduh data finalpass dari kumpulan data Sceneflow serta data Disparitas .
KITI 2015
Unduh kumpulan data kitti15, dan unzip data_scene_flow.zip, ganti namanya menjadi kitti15, dan pindahkan ke direktori SceneFlow seperti yang ditunjukkan pada pohon di bawah.
KITI 2012
Unduh kumpulan data kitti12. Buka zip data_stereo_flow.zip, ganti namanya menjadi kitti12, dan pindahkan ke direktori SceneFlow seperti yang ditunjukkan pada pohon di bawah.
Pastikan nama direktori cocok dengan pohon di bawah sehingga pemuat data dapat menemukan file.
Dalam pengaturan kami, kumpulan data disusun sebagai berikut
../../data
└── datasets
├── KITTI_raw
| ├── 2011_09_26
| │ ├── 2011_09_26_drive_0001_sync
| │ ├── 2011_09_26_drive_0002_sync
| | :
| |
| ├── 2011_09_28
| │ ├── 2011_09_28_drive_0001_sync
| │ └── 2011_09_28_drive_0002_sync
| | :
| | :
|
└── SceneFlow
├── driving
│ ├── disparity
│ └── frames_finalpass
├── flyingthings3d_final
│ ├── disparity
│ └── frames_finalpass
├── monkaa
│ ├── disparity
│ └── frames_finalpass
├── kitti12
│ ├── testing
│ └── training
└── kitti15
├── testing
└── training
Model KITTI yang telah dilatih sebelumnya sudah disertakan dalam './logs'. Berlari
python demo.py
untuk melakukan pencocokan stereo pada urutan kitti mentah. Berikut adalah contoh hasil pada sistem kami dengan RTX 2080Ti di Ubuntu 18.04.
Untuk hasil demo lebih lanjut, lihat halaman Proyek kami
Untuk melatih ulang model, konfigurasikan './configs/stereo/cfg_yaml', misalnya batch_size, path, nomor perangkat, presisi, dll. Kemudian jalankan
python stereo.py
Jika Anda merasa karya kami bermanfaat dalam penelitian Anda, mohon pertimbangkan untuk mengutip makalah kami
@inproceedings{bangunharcana2021correlate,
title={Correlate-and-Excite: Real-Time Stereo Matching via Guided Cost Volume Excitation},
author={Bangunharcana, Antyanta and Cho, Jae Won and Lee, Seokju and Kweon, In So and Kim, Kyung-Soo and Kim, Soohyun},
booktitle={2021 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)},
pages={3542--3548},
year={2021},
organization={IEEE}
}
Sebagian kode diadopsi dari karya sebelumnya: PSMNet, AANet, GANet, SpixelFCN