VERI-Wild: ชุดข้อมูลขนาดใหญ่และวิธีการใหม่ในการระบุยานพาหนะซ้ำในป่า
ชุดข้อมูล ReID ของยานพาหนะขนาดใหญ่ในป่า (VERI-Wild) ถูกจับจากระบบกล้องวงจรปิดขนาดใหญ่ที่ประกอบด้วยกล้อง 174 ตัวในหนึ่งเดือน (30*24 ชั่วโมง) ภายใต้สถานการณ์ที่ไม่มีข้อจำกัด กล้องถูกจำหน่ายในเขตเมืองขนาดใหญ่ที่มีระยะทางมากกว่า 200 กม.2 YOLO-v2 [2] ใช้เพื่อตรวจจับกล่องขอบเขตของยานพาหนะ ชุดรูปภาพยานพาหนะดิบประกอบด้วยรูปภาพยานพาหนะ 12 ล้านรูป และอาสาสมัคร 11 คนได้รับเชิญให้ล้างชุดข้อมูลเป็นเวลา 1 เดือน หลังจากทำความสะอาดข้อมูลและใส่คำอธิบายประกอบแล้ว จะมีการรวบรวมรูปภาพยานพาหนะ 416,314 รูปจากข้อมูลระบุตัวตน 40,671 รายการ สถิติของ VERI-Wild แสดงไว้ในรูปที่. สำหรับปัญหาความเป็นส่วนตัว ป้ายทะเบียนจะถูกปกปิดในชุดข้อมูล คุณสมบัติที่โดดเด่นของ VERI-Wild สรุปได้ดังต่อไปนี้:
Unconstrained capture conditions in the wild
ชุดข้อมูล VERI-Wild ถูกรวบรวมจากระบบกล้องวงจรปิดจริงที่ประกอบด้วยกล้องวงจรปิด 174 ตัว ซึ่งเงื่อนไขในการจับภาพที่ไม่มีข้อจำกัดก่อให้เกิดความท้าทายหลายประการ
Complex capture conditions
กล้องวงจรปิด 174 ตัวกระจายอยู่ในเขตเมืองที่มีพื้นที่มากกว่า 200 กม.2 นำเสนอภูมิหลัง ความละเอียด มุมมอง และการบดบังที่หลากหลายในป่า ในกรณีที่ร้ายแรง ยานพาหนะคันหนึ่งจะปรากฏในกล้องที่แตกต่างกันมากกว่า 40 ตัว ซึ่งอาจเป็นเรื่องที่ท้าทายสำหรับอัลกอริธึม ReID
Large time span involving severe illumination and weather changes
VERI-Wild รวบรวมจากระยะเวลาวิดีโอ 125, 280 (174x24x30) ชั่วโมง รูปที่ (b) แสดงการกระจายตัวของยานพาหนะในช่วงเวลา 4 ช่วง คือ 24 ชั่วโมง กล่าวคือ เช้า เที่ยง บ่าย และเย็น ตลอด 30 วัน VERI-Wild ยังมีสภาพอากาศที่ไม่เอื้ออำนวย เช่น ฝนตก หมอกลง ฯลฯ ซึ่งไม่ได้ระบุไว้ในชุดข้อมูลก่อนหน้านี้
Rich Context Information
เราให้ข้อมูลบริบทที่หลากหลาย เช่น ID กล้อง การประทับเวลา ติดตามความสัมพันธ์ระหว่างกล้อง ซึ่งมีศักยภาพในการอำนวยความสะดวกในการวิจัยเกี่ยวกับการวิเคราะห์พฤติกรรมในเครือข่ายกล้อง เช่น การสร้างแบบจำลองพฤติกรรมของยานพาหนะ การติดตามผ่านกล้อง และการดึงข้อมูลตามกราฟ
สำคัญ!!!!!!!!!
โปรดทราบว่าสำหรับชุดการทดสอบ VERI-Wild ที่มีรูปภาพที่ใช้ค้นหา คุณจะต้องลบรูปภาพที่มีรหัสกล้องเดียวกันและรหัสยานพาหนะเดียวกันกับรูปภาพที่ใช้ค้นหาในชุดแกลเลอรี สิ่งเหล่านี้จะไม่ได้รับการพิจารณาเมื่อคำนวณ mAP และ CMC
@inproceedings{lou2019large, title={VERI-Wild: A Large Dataset and a New Method for Vehicle Re-Identification in the Wild}, author={Lou, Yihang and Bai, Yan and Liu, Jun and Wang, Shiqi and Duan, Ling-Yu}, booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition}, pages = {3235--3243}, year={2019} }
@inproceedings{lou2019large, title={Disentangled Feature Learning Network and a Comprehensive Benchmark for Vehicle Re-Identification}, author={Bai, Yan and Liu, Jun and Lou, Yihang and Wang, Ce and Duan, Ling-Yu}, booktitle={In IEEE Transactions on Pattern Analysis and Machine Intelligence}, year={2021} }
หยานไป๋ อีเมล: [email protected]
เพื่อสนับสนุนการวิจัยที่เกี่ยวข้อง เราจะจัดเตรียมชุดข้อมูลตามคำขอของคุณ กรุณาส่งอีเมลชื่อนามสกุลและความเกี่ยวข้องของคุณไปยังผู้ติดต่อ (yanbai ที่ pku dot edu dot cn) เราขอข้อมูลของคุณเพียงเพื่อให้แน่ใจว่าชุดข้อมูลนั้นถูกใช้เพื่อวัตถุประสงค์ที่ไม่ใช่เชิงพาณิชย์ เราจะไม่มอบให้กับบุคคลที่สามหรือเผยแพร่ต่อสาธารณะทุกที่ เนื่องจากปัญหาความเป็นส่วนตัว เราจะไม่จัดเตรียมป้ายทะเบียนให้อีกในอนาคต หากคุณดาวน์โหลดชุดข้อมูลของเรา แสดงว่าคุณได้ยอมรับข้อกำหนดในการเข้าถึงของเราทางอีเมล
วิธีการ | เล็ก | ปานกลาง | ใหญ่ | ||||||
แผนที่ | อันดับ1 | ท็อป5 | แผนที่ | อันดับ1 | ท็อป5 | แผนที่ | อันดับ1 | ท็อป5 | |
กูเกิลเน็ต[1] | 24.27 | 57.16 | 75.13 | 24.15 | 53.16 | 71.1 | 21.53 | 44.61 | 63.55 |
อย.สุทธิ(VGGM)[2] | 35.11 | 64.03 | 82.80 | 29.80 | 57.82 | 78.34 | 22.78 | 49.43 | 70.48 |
MLSL[3] | 46.32 | - | - | 42.37 | - | - | 36.61 | - | - |
ทริปเปิล(Resnet50) | 58.43 | 65.76 | 86.98 | 49.72 | 57.76 | 80.86 | 38.57 | 47.65 | 71.66 |
FDA-Net(Resnet50)[2] | 61.57 | 73.62 | 91.23 | 52.69 | 64.29 | 85.39 | 45.78 | 58.76 | 80.97 |
AAVER(เรสเน็ต50)[4] | 62.23 | 75.80 | 92.70 | 53.66 | 68.24 | 88.88 | 41.68 | 58.69 | 81.59 |
ดีเอฟแอลเน็ต(Resnet50)[5] | 68.21 | 80.68 | 93.24 | 60.07 | 70.67 | 89.25 | 49.02 | 61.60 | 82.73 |
บีเอส(โมบายเน็ต)[6] | 70.54 | 84.17 | 95.30 | 62.83 | 78.22 | 93.06 | 51.63 | 69.99 | 88.45 |
UMTS(เรสเน็ต50)[7] | 72.7 | 84.5 | - | 66.1 | 79.3 | - | 54.2 | 72.8 | - |
เบสไลน์ที่แข็งแกร่ง(Resnet50)[8] | 76.61 | 90.83 | 97.29 | 70.11 | 87.45 | 95.24 | 61.3 | 82.58 | 92.73 |
HPGN(เรสเน็ต50+PGN)[9] | 80.42 | 91.37 | - | 75.17 | 88.21 | - | 65.04 | 82.68 | - |
เย้ายวนใจ(Resnet50+PGN)[10] | 77.15 | 92.13 | 97.43 | - | - | - | - | - | - |
พีเวน(เรสเน็ต50)[12] | 79.8 | 94.01 | 98.06 | 73.9 | 92.03 | 97.15 | 66.2 | 88.62 | 95.31 |
โปรแกรมประหยัด(Resnet50)[11] | 80.9 | 93.78 | 97.93 | 75.3 | 92.7 | 97.48 | 67.7 | 89.5 | 95.8 |
DFNet(Resnet50)[14] | 83.09 | 94.79 | 98.05 | 77.27 | 93.22 | 97.46 | 69.85 | 89.38 | 96.03 |
วิธีการ | ทดสอบชุดทั้งหมด | ชุดทดสอบ A | ชุดทดสอบ B | ||||||
แผนที่ | อันดับ1 | ท็อป5 | แผนที่ | อันดับ1 | ท็อป5 | แผนที่ | อันดับ1 | ท็อป5 | |
พื้นฐานที่แข็งแกร่ง (Resnet50) [8] | 34.71 | 54.37 | 63.99 | 32.75 | 40.12 | 52.18 | 42.25 | 82.72 | 90.67 |
GSTE (Resnet50) (พร้อมลูกเล่นมากมาย)[13] | 32.57 | 59.25 | 64.48 | 33.01 | 47.54 | 50.81 | 41.82 | 86.08 | 91.43 |
FDA-Net (Resnet50)(มีเคล็ดลับ) [2] | 34.21 | 57.32 | 64.90 | 34.63 | 45.53 | 52.77 | 3.93 | 84.78 | 92.47 |
เอเวอร์ (เรสเน็ต50) [41] | 36.8 | 59.1 | 67.6 | 36.8 | 48.7 | 57.3 | 45.4 | 86.1 | 94.3 |
พีเวน(เรสเน็ต50)[12] | 37.15 | 61.19 | 68.63 | 38.77 | 51.28 | 59.32 | 45.48 | 88.05 | 94.35 |
โปรแกรมประหยัด(Resnet50)[11] | 38.0 | 62.1 | 69.50 | 39.2 | 52.3 | 60.2 | 45.1 | 88.1 | 94.1 |
DFNet(Resnet50)[14] | 39.84 | 62.21 | 68.90 | 40.39 | 51.68 | 60.51 | 46.13 | 88.56 | 94.17 |
[1] Yang, L., Luo, P., Change Loy, C., Tang, X.: ชุดข้อมูลรถยนต์ขนาดใหญ่สำหรับการจัดหมวดหมู่และการตรวจสอบอย่างละเอียด ใน: การประชุม IEEE เรื่องคอมพิวเตอร์วิทัศน์และการจดจำรูปแบบ (2558)
(2) Lou, Y., Bai, Y., Liu, J., Wang, S., Duan, L.: Veri-wild: ชุดข้อมูลขนาดใหญ่และวิธีการใหม่สำหรับการระบุตัวตนยานพาหนะอีกครั้งในป่า ใน: การประชุม IEEE เรื่อง ComputerVision และการรับรู้รูปแบบ (2019)
(3) Alfasly, S. , Hu, Y. , Li, H. , Liang, T. , Jin, X. , Liu, B. , Zhao, Q.: การเรียนรู้ความคล้ายคลึงกันแบบหลายป้ายกำกับสำหรับการระบุยานพาหนะอีกครั้ง การเข้าถึง IEEE7 (2019)
(4) Pirazh, K. , Kumar, A. , Peri, N. , et al: โมเดลเส้นทางคู่พร้อมการปรับความสนใจเพื่อระบุตัวตนของยานพาหนะอีกครั้ง ใน: การประชุมนานาชาติ IEEE เรื่องคอมพิวเตอร์วิทัศน์ (2019)
(5) Yan Bai, Yihang Lou, Yongxing Dai และคณะ: เครือข่ายการเรียนรู้คุณลักษณะที่ไม่พันกันสำหรับการระบุยานพาหนะอีกครั้ง ใน: IJCAI 2020
(6) Kuma Ratnesh และ Weill Edwin และคณะ: การระบุยานพาหนะอีกครั้ง: พื้นฐานที่มีประสิทธิภาพโดยใช้การฝังแฝด ใน IJCNN 2019
[7] Xin Jin, Cuiling Lan, Wenjun Zeng, Zhibo Chen: การกลั่นความรู้หลายช็อตที่ไม่แน่นอนเพื่อการระบุวัตถุโดยใช้ภาพอีกครั้ง ใน: AAAI 2020
[8] Luo Hao และ Gu Youzhi และคณะ: Bag of Tricks และพื้นฐานที่แข็งแกร่งสำหรับการระบุตัวตนบุคคลที่ลึกซึ้งอีกครั้ง ในการประชุมเชิงปฏิบัติการ CVPR 2019
(9) Shen Fei, Zhu Jianqing และคณะ: การสำรวจความสำคัญเชิงพื้นที่ผ่านเครือข่ายกราฟพีระมิดแบบไฮบริดเพื่อการระบุตัวตนยานพาหนะอีกครั้ง ในการพิมพ์ล่วงหน้า arXiv arXiv:2005.14684
[10] อภิจิต สุพรีม และคาลตัน ปู: ดูมีเสน่ห์: รหัสประจำตัวยานพาหนะในเครือข่ายกล้องที่แตกต่างกันซึ่งได้รับความสนใจจากทั่วโลกและท้องถิ่น ในการพิมพ์ล่วงหน้า arXiv arXiv:2002.02256
[11] Khorramshahi Pirazh, Peri Neehar, Chen Jun-cheng, Chellappa Rama: ปีศาจอยู่ในรายละเอียด: การดูแลตนเองเพื่อการระบุตัวตนยานพาหนะอีกครั้ง ใน ECCV 2020
[12] เม้ง เดเฉา และคณะ "เครือข่ายการฝังแบบรับรู้การมองเห็นแบบแยกวิเคราะห์สำหรับการระบุยานพาหนะอีกครั้ง" การดำเนินการประชุม IEEE/CVF เรื่องคอมพิวเตอร์วิทัศน์และการจดจำรูปแบบ 2020.
[13] หยานไป๋, อี้หังโหลว, เฟิงเกา, ซือชีหวาง, หยูเว่ยหวู่ และหลิงหยู่ต้วน การฝัง Triplet ที่ละเอียดอ่อนแบบกลุ่มเพื่อการระบุตัวตนยานพาหนะอีกครั้ง ธุรกรรม IEEE บนมัลติมีเดีย, 2018
[14] หยานไป๋, จุนหลิว, อี้หังโหลว, ซีหวาง และหลิงหยู่ด้วน เครือข่ายการเรียนรู้คุณลักษณะที่ไม่พันกันและเกณฑ์มาตรฐานที่ครอบคลุมสำหรับการระบุยานพาหนะอีกครั้ง ทาปามี 2021.