هذا هو تنفيذ "إثراء مجموعة متنوعة من معلومات التعلم الطبقية من خلال دمج التدرج" باستخدام إطار عمل Darknet.
ستظهر ورقتنا في ورشة عمل ICCV لعام 2019 حول رؤية الكمبيوتر منخفضة الطاقة.
لتثبيت إطار عمل Darknet، يمكنك الرجوع إلى darknet(pjreddie) أو darknet(AlexeyAB).
نحن نقدم ملف YOLO-v3-tiny-PRN cfg ونموذج COCO المُدرب مسبقًا. يمكنك استخدام الملفات المتوفرة للحصول على النتائج التالية في مجموعة اختبار COCO:
نموذج | ماب@0.5 | بفلوب | # المعلمة | GPU إطارا في الثانية | إطار وحدة المعالجة المركزية |
---|---|---|---|---|---|
يولو-v3-تيني [1] | 33.1 | 5.571 | 8.86 م | 300 | 8 |
YOLO-v3-tiny-PRN | 33.1 | 3.467 | 4.95 م | 370 | 13 |
نحن نقدم أيضًا ملف cfg ونموذج COCO مُدرب مسبقًا للعمود الفقري الحديث EfficientNet_b0 [2]. لتدريب هذا النموذج، يجب عليك تثبيت darknet(AlexeyAB).
نموذج | مقاس | ماب@0.5 | بفلوب |
---|---|---|---|
EfficientNet_b0-PRN | 416x416 | 45.5 | 3.730 |
EfficientNet_b0-PRN | 320x320 | 41.0 | 2.208 |
نقدم هنا بعض النتائج التجريبية لمجموعة اختبار COCO غير المدرجة في الورقة.
نموذج | مقاس | ماب@0.5 | بفلوب | # المعلمة |
---|---|---|---|---|
بيليه [3] | 304x304 | 38.3 | 2.58 | 5.98 م |
بيليه-PRN | 320x320 | 40.9 | 2.39 | 3.16 م |
بيلي-YOLOv3 [1] | 320x320 | 41.4 | 2.99 | 3.91 م |
بيلي-FPN [4] | 320x320 | 41.4 | 2.86 | 3.75 م |
بيلي-PRN-3l | 320x320 | 42.5 | 3.98 | 3.36 م |
م بيلي-PRN | 320x320 | 42.7 | 2.82 | 3.81 م |
نموذج | مقاس | ماب@0.5 | بفلوب | # المعلمة | GPU إطارا في الثانية | إطار وحدة المعالجة المركزية |
---|---|---|---|---|---|---|
بيليه-PRN | 416x416 | 45.0 | 4.04 | 3.16 م | 111 | 6.0 |
بيلي-YOLOv3 [1] | 416x416 | 45.3 | 5.06 | 3.91 م | 115 | 5.5 |
بيلي-FPN [4] | 416x416 | 45.7 | 4.84 | 3.75 م | 115 | 5.8 |
بيلي-PRN-3l | 416x416 | 46.3 | 5.03 | 3.36 م | ||
م بيلي-PRN | 416x416 | 46.8 | 4.76 | 3.81 م | 104 |
[1] ريدمون، ج.، وفرهادي، أ. (2018). Yolov3: تحسن تدريجي. arXiv الطباعة المسبقة arXiv:1804.02767.
[2] تان، م.، ولي، كيو في (2019). EfficientNet: إعادة التفكير في قياس نموذج الشبكات العصبية التلافيفية. طبعة arXiv المسبقة arXiv:1905.11946.
[3] وانغ، آر جي، لي، إكس، ولينغ، سي إكس (2018). Pelee: نظام الكشف عن الأشياء في الوقت الحقيقي على الأجهزة المحمولة. في التقدم في أنظمة معالجة المعلومات العصبية (ص 1963-1972).
[4] لين، تي واي، دولار، بي.، جيرشيك، آر، هي، كيه، هاريهاران، بي، وبيلونج، إس (2017). تتميز بالشبكات الهرمية للكشف عن الأشياء. في وقائع مؤتمر IEEE حول رؤية الكمبيوتر والتعرف على الأنماط (ص 2117-2125).
https://github.com/AlexeyAB/darknet