这是“通过梯度组合丰富分层学习信息的多样性”使用Darknet框架的实现。
我们的论文将发表在 2019 年 ICCV 低功耗计算机视觉研讨会上。
安装Darknet框架可以参考darknet(pjreddie)或darknet(AlexeyAB)。
我们提供YOLO-v3-tiny-PRN cfg文件和COCO预训练模型。您可以使用提供的文件在 COCO 测试开发集上获得以下结果:
模型 | 地图@0.5 | BFLOP | # 范围 | GPU 帧率 | CPU帧率 |
---|---|---|---|---|---|
YOLO-v3-微小 [1] | 33.1 | 5.571 | 8.86M | 300 | 8 |
YOLO-v3-tiny-PRN | 33.1 | 3.467 | 4.95M | 370 | 13 |
我们还为现代骨干网 EfficientNet_b0 [2] 提供 cfg 文件和 COCO 预训练模型。为了训练这个模型,你应该安装 darknet(AlexeyAB)。
模型 | 尺寸 | 地图@0.5 | BFLOP |
---|---|---|---|
EfficientNet_b0-PRN | 416x416 | 45.5 | 3.730 |
EfficientNet_b0-PRN | 320x320 | 41.0 | 2.208 |
这里我们提供了一些在COCO测试开发集上的实验结果,这些结果没有在论文中列出。
模型 | 尺寸 | 地图@0.5 | BFLOP | # 范围 |
---|---|---|---|---|
皮利 [3] | 304x304 | 38.3 | 2.58 | 5.98M |
皮利-PRN | 320x320 | 40.9 | 2.39 | 3.16M |
Pelee-YOLOv3 [1] | 320x320 | 41.4 | 2.99 | 3.91M |
皮利-FPN [4] | 320x320 | 41.4 | 2.86 | 3.75M |
皮利-PRN-3l | 320x320 | 42.5 | 3.98 | 3.36M |
mPee-PRN | 320x320 | 42.7 | 2.82 | 3.81M |
模型 | 尺寸 | 地图@0.5 | BFLOP | # 范围 | GPU 帧率 | CPU帧率 |
---|---|---|---|---|---|---|
皮利-PRN | 416x416 | 45.0 | 4.04 | 3.16M | 111 | 6.0 |
Pelee-YOLOv3 [1] | 416x416 | 45.3 | 5.06 | 3.91M | 115 | 5.5 |
皮利-FPN [4] | 416x416 | 45.7 | 4.84 | 3.75M | 115 | 5.8 |
皮利-PRN-3l | 416x416 | 46.3 | 5.03 | 3.36M | ||
mPee-PRN | 416x416 | 46.8 | 4.76 | 3.81M | 104 |
[1] 雷德蒙,J.,&法哈迪,A.(2018)。 Yolov3:渐进式改进。 arXiv 预印本 arXiv:1804.02767。
[2] Tan, M., & Le, QV (2019)。 EfficientNet:重新思考卷积神经网络的模型扩展。 arXiv 预印本 arXiv:1905.11946。
[3] 王RJ、李X、凌CX (2018)。 Pelee:移动设备上的实时物体检测系统。神经信息处理系统的进展(第 1963-1972 页)。
[4] Lin, TY、Dollár, P.、Girshick, R.、He, K.、Hariharan, B. 和 Belongie, S. (2017)。用于目标检测的特征金字塔网络。 IEEE 计算机视觉和模式识别会议论文集(第 2117-2125 页)。
https://github.com/AlexeyAB/darknet