นี่คือการนำ "การเพิ่มความหลากหลายของข้อมูลการเรียนรู้แบบเลเยอร์ด้วยการผสมผสานการไล่ระดับสี" โดยใช้กรอบงาน Darknet
บทความของเราจะปรากฏในการประชุมเชิงปฏิบัติการ ICCV เรื่องคอมพิวเตอร์วิทัศน์พลังงานต่ำประจำปี 2019
สำหรับการติดตั้งเฟรมเวิร์ก Darknet คุณสามารถดู darknet(pjreddie) หรือ darknet(AlexeyAB)
เราจัดเตรียมไฟล์ cfg YOLO-v3-tiny-PRN และโมเดลที่ผ่านการฝึกอบรมล่วงหน้าของ COCO คุณสามารถใช้ไฟล์ที่ให้มาเพื่อรับผลลัพธ์ต่อไปนี้ในชุดทดสอบ COCO:
แบบอย่าง | เอ็มเอพี@0.5 | BFLOP | #พารามิเตอร์ | จีพียูเอฟพีเอส | ซีพียู FPS |
---|---|---|---|---|---|
YOLO-v3-จิ๋ว [1] | 33.1 | 5.571 | 8.86ม | 300 | 8 |
YOLO-v3-จิ๋ว-PRN | 33.1 | 3.467 | 4.95ล้าน | 370 | 13 |
นอกจากนี้เรายังจัดเตรียมไฟล์ cfg และโมเดลที่ผ่านการฝึกอบรมล่วงหน้าของ COCO สำหรับ morden backbone EfficientNet_b0 [2] สำหรับการฝึกโมเดลนี้ คุณควรติดตั้ง darknet(AlexeyAB)
แบบอย่าง | ขนาด | เอ็มเอพี@0.5 | BFLOP |
---|---|---|---|
EfficientNet_b0-PRN | 416x416 | 45.5 | 3.730 |
EfficientNet_b0-PRN | 320x320 | 41.0 | 2.208 |
ที่นี่เรานำเสนอผลการทดลองบางส่วนเกี่ยวกับชุดทดสอบ COCO ที่ไม่ได้ระบุไว้ในรายงาน
แบบอย่าง | ขนาด | เอ็มเอพี@0.5 | BFLOP | #พารามิเตอร์ |
---|---|---|---|---|
เปเล่ [3] | 304x304 | 38.3 | 2.58 | 5.98ล้าน |
พีลี-PRN | 320x320 | 40.9 | 2.39 | 3.16ม |
เปลี-โยโลฟ3 [1] | 320x320 | 41.4 | 2.99 | 3.91ล้าน |
พีลี-เอฟพีเอ็น [4] | 320x320 | 41.4 | 2.86 | 3.75ล้าน |
เปลี-PRN-3l | 320x320 | 42.5 | 3.98 | 3.36ม |
มเปลี-PRN | 320x320 | 42.7 | 2.82 | 3.81ล้าน |
แบบอย่าง | ขนาด | เอ็มเอพี@0.5 | BFLOP | #พารามิเตอร์ | จีพียูเอฟพีเอส | ซีพียู FPS |
---|---|---|---|---|---|---|
พีลี-PRN | 416x416 | 45.0 | 4.04 | 3.16ม | 111 | 6.0 |
เปลี-โยโลฟ3 [1] | 416x416 | 45.3 | 5.06 | 3.91ล้าน | 115 | 5.5 |
พีลี-เอฟพีเอ็น [4] | 416x416 | 45.7 | 4.84 | 3.75ล้าน | 115 | 5.8 |
เปลี-PRN-3l | 416x416 | 46.3 | 5.03 | 3.36ม | ||
มเปลี-PRN | 416x416 | 46.8 | 4.76 | 3.81ล้าน | 104 |
[1] เรดมอน เจ. และฟาร์ฮาดี เอ. (2018) Yolov3: การปรับปรุงที่เพิ่มขึ้น arXiv พิมพ์ล่วงหน้า arXiv:1804.02767
[2] แทน, เอ็ม., & เลอ, คิววี (2019) EfficientNet: ทบทวนการปรับขนาดแบบจำลองสำหรับโครงข่ายประสาทเทียมแบบ Convolutional arXiv พิมพ์ล่วงหน้า arXiv:1905.11946
(3) วัง, RJ, Li, X. และหลิง, CX (2018) Pelee: ระบบตรวจจับวัตถุแบบเรียลไทม์บนอุปกรณ์พกพา ในความก้าวหน้าของระบบประมวลผลข้อมูลประสาท (หน้า 2506-2515)
[4] Lin, TY, Dollár, P., Girshick, R., He, K., Hariharan, B., & Belongie, S. (2017) มีเครือข่ายพีระมิดสำหรับการตรวจจับวัตถุ ในการดำเนินการประชุม IEEE ว่าด้วยการมองเห็นคอมพิวเตอร์และการจดจำรูปแบบ (หน้า 2117-2125)
https://github.com/AlexeyAB/darknet