VERI-Wild : un vaste ensemble de données et une nouvelle méthode de réidentification des véhicules dans la nature
Un ensemble de données ReID de véhicules à grande échelle dans la nature (VERI-Wild) est capturé à partir d'un grand système de surveillance CCTV composé de 174 caméras sur un mois (30*24h) dans des scénarios sans contraintes. Les caméras sont réparties dans une grande zone urbaine de plus de 200km2. Le YOLO-v2 [2] est utilisé pour détecter la boîte englobante des véhicules. L'ensemble d'images brutes de véhicules contient 12 millions d'images de véhicules et 11 volontaires sont invités à nettoyer l'ensemble de données pendant 1 mois. Après nettoyage et annotation des données, 416 314 images de véhicules représentant 40 671 identités sont collectées. Les statistiques de VERI-Wild sont illustrées dans la figure. Pour des questions de confidentialité, les plaques d'immatriculation sont masquées dans l'ensemble de données. Les caractéristiques distinctives de VERI-Wild sont résumées dans les aspects suivants :
Unconstrained capture conditions in the wild
L'ensemble de données VERI-Wild est collecté à partir d'un véritable système de caméras de vidéosurveillance composé de 174 caméras de surveillance, dans lequel les conditions de capture d'images sans contraintes posent de nombreux défis.
Complex capture conditions
Les 174 caméras de surveillance sont réparties dans une zone urbaine sur 200 km2, présentant différents arrière-plans, résolutions, points de vue et occlusions en pleine nature. Dans des cas extrêmes, un véhicule apparaît dans plus de 40 caméras différentes, ce qui constituerait un défi pour les algorithmes ReID.
Large time span involving severe illumination and weather changes
Le VERI-Wild est collecté sur une durée de 125 280 (174x24x30) heures vidéo. La figure (b) donne la répartition des véhicules en 4 tranches horaires de 24h, soit matin, midi, après-midi, soir sur 30 jours. VERI-Wild contient également de mauvaises conditions météorologiques, telles que pluie, brouillard, etc., qui ne sont pas fournies dans les ensembles de données précédents.
Rich Context Information
Nous fournissons des informations contextuelles riches telles que les identifiants des caméras, l'horodatage, les relations entre les caméras, qui sont susceptibles de faciliter la recherche sur l'analyse du comportement dans les réseaux de caméras, comme la modélisation du comportement des véhicules, le suivi entre caméras et la récupération basée sur des graphiques.
Important!!!!!!!!!
Notez que, pour l'ensemble de test VERI-Wild, étant donné une image de requête, vous devez supprimer les images avec le même identifiant de caméra et le même identifiant de véhicule que l'image de requête dans l'ensemble de galerie. Ils ne sont pas pris en compte lors du calcul du mAP et du CMC.
@inproceedings{lou2019large,
title={VERI-Wild: A Large Dataset and a New Method for Vehicle Re-Identification in the Wild},
author={Lou, Yihang and Bai, Yan and Liu, Jun and Wang, Shiqi and Duan, Ling-Yu},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
pages = {3235--3243},
year={2019}
}
@inproceedings{lou2019large,
title={Disentangled Feature Learning Network and a Comprehensive Benchmark for Vehicle Re-Identification},
author={Bai, Yan and Liu, Jun and Lou, Yihang and Wang, Ce and Duan, Ling-Yu},
booktitle={In IEEE Transactions on Pattern Analysis and Machine Intelligence},
year={2021}
}
Yan Bai, e-mail : [email protected]
Pour encourager les recherches connexes, nous fournirons l’ensemble de données en fonction de votre demande. Veuillez envoyer votre nom complet et votre affiliation à la personne de contact (yanbai at pku dot edu dot cn). Nous demandons vos informations uniquement pour nous assurer que l'ensemble de données est utilisé à des fins non commerciales. Nous ne le communiquerons à aucun tiers ni ne le publierons publiquement nulle part. En raison de problèmes de confidentialité, nous ne fournirons pas les plaques d'immatriculation à l'avenir. Si vous téléchargez notre ensemble de données, cela signifie que vous avez accepté nos conditions d'accès dans l'e-mail.
Méthodes | Petit | Moyen | Grand | ||||||
carte | Top1 | Top5 | carte | Top1 | Top5 | carte | Top1 | Top5 | |
GoogleNet[1] | 24.27 | 57.16 | 75.13 | 24h15 | 53.16 | 71.1 | 21h53 | 44.61 | 63,55 |
FDA-Net(VGGM)[2] | 35.11 | 64.03 | 82,80 | 29.80 | 57,82 | 78.34 | 22.78 | 49.43 | 70.48 |
MLSL[3] | 46.32 | - | - | 42.37 | - | - | 36.61 | - | - |
Triplet (Resnet50) | 58.43 | 65,76 | 86,98 | 49.72 | 57,76 | 80,86 | 38.57 | 47,65 | 71,66 |
FDA-Net(Resnet50)[2] | 61,57 | 73.62 | 91.23 | 52,69 | 64.29 | 85.39 | 45,78 | 58,76 | 80,97 |
AAVER(Resnet50)[4] | 62.23 | 75,80 | 92,70 | 53,66 | 68.24 | 88,88 | 41,68 | 58,69 | 81,59 |
DFLNet(Resnet50)[5] | 68.21 | 80,68 | 93.24 | 60.07 | 70,67 | 89.25 | 49.02 | 61,60 | 82,73 |
BS (réseau mobile) [6] | 70.54 | 84.17 | 95h30 | 62,83 | 78.22 | 93.06 | 51,63 | 69,99 | 88.45 |
UMTS(Resnet50)[7] | 72,7 | 84,5 | - | 66.1 | 79,3 | - | 54.2 | 72,8 | - |
Ligne de base forte (Resnet50)[8] | 76.61 | 90,83 | 97.29 | 70.11 | 87.45 | 95.24 | 61,3 | 82,58 | 92,73 |
HPGN(Resnet50+PGN)[9] | 80.42 | 91.37 | - | 75.17 | 88.21 | - | 65.04 | 82,68 | - |
GLAMOUR(Resnet50+PGN)[10] | 77.15 | 92.13 | 97.43 | - | - | - | - | - | - |
PVEN(Resnet50)[12] | 79,8 | 94.01 | 98.06 | 73,9 | 92.03 | 97.15 | 66.2 | 88,62 | 95.31 |
ÉCONOMISEUR(Resnet50)[11] | 80,9 | 93,78 | 97.93 | 75.3 | 92,7 | 97.48 | 67,7 | 89,5 | 95,8 |
DFNet(Resnet50)[14] | 83.09 | 94,79 | 98.05 | 77.27 | 93.22 | 97.46 | 69,85 | 89.38 | 96.03 |
Méthodes | Tester tout | Ensemble de tests A | Ensemble de tests B | ||||||
carte | Top1 | Top5 | carte | Top1 | Top5 | carte | Top1 | Top5 | |
Base de référence solide (Resnet50) [8] | 34.71 | 54.37 | 63,99 | 32,75 | 40.12 | 52.18 | 42.25 | 82,72 | 90,67 |
GSTE (Resnet50) (avec sac à astuces)[13] | 32.57 | 59.25 | 64.48 | 33.01 | 47.54 | 50,81 | 41,82 | 86.08 | 91.43 |
FDA-Net (Resnet50) (avec sac à astuces) [2] | 34.21 | 57.32 | 64,90 | 34,63 | 45.53 | 52,77 | 3,93 | 84,78 | 92.47 |
JAMAIS (Resnet50) [41] | 36,8 | 59.1 | 67,6 | 36,8 | 48,7 | 57.3 | 45.4 | 86.1 | 94,3 |
PVEN(Resnet50)[12] | 37h15 | 61.19 | 68,63 | 38,77 | 51.28 | 59.32 | 45.48 | 88.05 | 94.35 |
ÉCONOMISEUR(Resnet50)[11] | 38,0 | 62.1 | 69.50 | 39.2 | 52.3 | 60,2 | 45.1 | 88.1 | 94.1 |
DFNet(Resnet50)[14] | 39,84 | 62.21 | 68.90 | 40.39 | 51,68 | 60.51 | 46.13 | 88,56 | 94.17 |
[1] Yang, L., Luo, P., Change Loy, C., Tang, X. : Un ensemble de données automobiles à grande échelle pour une catégorisation et une vérification fines. Dans : Conférence IEEE sur la vision par ordinateur et la reconnaissance de formes. (2015)
[2] Lou, Y., Bai, Y., Liu, J., Wang, S., Duan, L. : Veri-wild : Un vaste ensemble de données et une nouvelle méthode de réidentification des véhicules dans la nature. Dans : Conférence IEEE sur la vision par ordinateur et la reconnaissance de formes. (2019)
[3] Alfasly, S., Hu, Y., Li, H., Liang, T., Jin, X., Liu, B., Zhao, Q. : Apprentissage de similarité basé sur plusieurs étiquettes pour la réidentification des véhicules. Accès IEEE7 (2019)
[4] Pirazh, K., Kumar, A., Peri, N., et al : Un modèle à double voie avec attention adaptative pour la réidentification des véhicules. Dans : Conférence internationale de l'IEEE sur la vision par ordinateur (2019)
[5] Yan Bai, Yihang Lou, Yongxing Dai, et al : Réseau d'apprentissage des fonctionnalités disentangled pour la réidentification des véhicules. Dans : IJCAI 2020
[6] Kuma Ratnesh et Weill Edwin et et al : Ré-identification des véhicules : une base de référence efficace utilisant l'intégration de triplet. DANS IJCNN 2019
[7] Xin Jin, Cuiling Lan, Wenjun Zeng, Zhibo Chen : Distillation de connaissances multi-shots tenant compte de l'incertitude pour la réidentification d'objets basée sur l'image. Dans : AAAI 2020
[8] Luo Hao et Gu Youzhi et et al : Un sac d'astuces et une base solide pour la réidentification approfondie des personnes. Dans l'atelier CVPR 2019.
[9] Shen Fei, Zhu Jianqing et et al : Exploration de la signification spatiale via un réseau de graphiques pyramidaux hybrides pour la réidentification des véhicules. Dans la préimpression arXiv arXiv:2005.14684
[10] Abhijit Suprem et Calton Pu : Looking GLAMOURous : Re-Id des véhicules dans des réseaux de caméras hétérogènes avec une attention mondiale et locale. Dans la préimpression arXiv arXiv:2002.02256
[11] Khorramshahi Pirazh, Peri Neehar, Chen Jun-cheng, Chellappa Rama : Le diable est dans les détails : Attention auto-supervisée pour la réidentification des véhicules. Dans ECCV 2020
[12] Meng, Dechao et coll. "Réseau d'intégration basé sur l'analyse pour la réidentification des véhicules." Actes de la conférence IEEE/CVF sur la vision par ordinateur et la reconnaissance de formes. 2020.
[13] Yan Bai, Yihang Lou, Feng Gao, Shiqi Wang, Yuwei Wu et Lingyu Duan. Intégration de triplet sensible au groupe pour la ré-identification du véhicule. Transactions IEEE sur le multimédia, 2018.
[14] Yan Bai, Jun Liu, Yihang Lou, Ce Wang et Lingyu Duan. Réseau d'apprentissage des fonctionnalités démêlé et référence complète pour la réidentification des véhicules. Tpami 2021.