Esta es la implementación de "Enriquecimiento de la variedad de información de aprendizaje por capas mediante combinación de gradientes" utilizando el marco Darknet.
Nuestro artículo aparecerá en el Taller ICCV de 2019 sobre visión por computadora de bajo consumo.
Para instalar el marco Darknet, puede consultar darknet (pjreddie) o darknet (AlexeyAB).
Proporcionamos el archivo cfg YOLO-v3-tiny-PRN y el modelo COCO previamente entrenado. Puede utilizar los archivos proporcionados para obtener los siguientes resultados en el conjunto de desarrollo de pruebas de COCO:
Modelo | [email protected] | BFLOP | # Parámetro | FPS de GPU | FPS de la CPU |
---|---|---|---|---|---|
YOLO-v3-pequeño [1] | 33.1 | 5.571 | 8,86 millones | 300 | 8 |
YOLO-v3-tiny-PRN | 33.1 | 3.467 | 4,95 millones | 370 | 13 |
También proporcionamos el archivo cfg y el modelo COCO previamente entrenado para la columna vertebral moderna EfficientNet_b0 [2]. Para entrenar este modelo, debe instalar darknet (AlexeyAB).
Modelo | Tamaño | [email protected] | BFLOP |
---|---|---|---|
EfficientNet_b0-PRN | 416x416 | 45,5 | 3.730 |
EfficientNet_b0-PRN | 320x320 | 41.0 | 2.208 |
Aquí proporcionamos algunos resultados experimentales en el conjunto de desarrollo de pruebas de COCO que no figuran en el documento.
Modelo | Tamaño | [email protected] | BFLOP | # Parámetro |
---|---|---|---|---|
Pelé [3] | 304x304 | 38.3 | 2.58 | 5,98 millones |
Pelee-PRN | 320x320 | 40,9 | 2.39 | 3,16 millones |
Pelee-YOLOv3 [1] | 320x320 | 41.4 | 2,99 | 3,91 millones |
Pelee-FPN [4] | 320x320 | 41.4 | 2,86 | 3,75 millones |
Pelee-PRN-3l | 320x320 | 42,5 | 3,98 | 3,36 millones |
mPelee-PRN | 320x320 | 42,7 | 2,82 | 3,81 millones |
Modelo | Tamaño | [email protected] | BFLOP | # Parámetro | FPS de GPU | FPS de la CPU |
---|---|---|---|---|---|---|
Pelee-PRN | 416x416 | 45.0 | 4.04 | 3,16 millones | 111 | 6.0 |
Pelee-YOLOv3 [1] | 416x416 | 45.3 | 5.06 | 3,91 millones | 115 | 5.5 |
Pelee-FPN [4] | 416x416 | 45,7 | 4.84 | 3,75 millones | 115 | 5.8 |
Pelee-PRN-3l | 416x416 | 46.3 | 5.03 | 3,36 millones | ||
mPelee-PRN | 416x416 | 46,8 | 4.76 | 3,81 millones | 104 |
[1] Redmon, J. y Farhadi, A. (2018). Yolov3: Una mejora incremental. Preimpresión de arXiv arXiv:1804.02767.
[2] Tan, M. y Le, QV (2019). EfficientNet: repensar el escalado de modelos para redes neuronales convolucionales. Preimpresión de arXiv arXiv:1905.11946.
[3] Wang, RJ, Li, X. y Ling, CX (2018). Pelee: un sistema de detección de objetos en tiempo real en dispositivos móviles. En Avances en los sistemas de procesamiento de información neuronal (págs. 1963-1972).
[4] Lin, TY, Dollár, P., Girshick, R., He, K., Hariharan, B. y Belongie, S. (2017). Presenta redes piramidales para la detección de objetos. En Actas de la Conferencia IEEE sobre visión por computadora y reconocimiento de patrones (págs. 2117-2125).
https://github.com/AlexeyAB/darknet