Esta é a implementação de "Variedade Enriquecida de Informações de Aprendizagem em Camadas por Combinação de Gradiente" usando a estrutura Darknet.
Nosso artigo será publicado no Workshop ICCV 2019 sobre Visão Computacional de Baixa Potência.
Para instalar a estrutura Darknet, você pode consultar darknet (pjreddie) ou darknet (AlexeyAB).
Fornecemos arquivo cfg YOLO-v3-tiny-PRN e modelo pré-treinado COCO. Você pode usar os arquivos fornecidos para obter os seguintes resultados no conjunto de desenvolvimento de teste COCO:
Modelo | mAP@0,5 | BFLOPs | # Parâmetro | GPU FPS | FPS da CPU |
---|---|---|---|---|---|
YOLO-v3-minúsculo [1] | 33.1 | 5.571 | 8,86 milhões | 300 | 8 |
YOLO-v3-tiny-PRN | 33.1 | 3.467 | 4,95 milhões | 370 | 13 |
Também fornecemos arquivo cfg e modelo pré-treinado COCO para backbone morden EfficientNet_b0 [2]. Para treinar este modelo, você deve instalar o darknet (AlexeyAB).
Modelo | Tamanho | mAP@0,5 | BFLOPs |
---|---|---|---|
EficienteNet_b0-PRN | 416x416 | 45,5 | 3.730 |
EficienteNet_b0-PRN | 320x320 | 41,0 | 2.208 |
Aqui fornecemos alguns resultados experimentais no conjunto de desenvolvimento de teste COCO que não estão listados no artigo.
Modelo | Tamanho | mAP@0,5 | BFLOPs | # Parâmetro |
---|---|---|---|---|
Pelee [3] | 304x304 | 38,3 | 2,58 | 5,98 milhões |
Pelee-PRN | 320x320 | 40,9 | 2,39 | 3,16 milhões |
Pelee-YOLOv3 [1] | 320x320 | 41,4 | 2,99 | 3,91 milhões |
Pelee-FPN [4] | 320x320 | 41,4 | 2,86 | 3,75 milhões |
Pelee-PRN-3l | 320x320 | 42,5 | 3,98 | 3,36 milhões |
mPelee-PRN | 320x320 | 42,7 | 2,82 | 3,81 milhões |
Modelo | Tamanho | mAP@0,5 | BFLOPs | # Parâmetro | GPU FPS | FPS da CPU |
---|---|---|---|---|---|---|
Pelee-PRN | 416x416 | 45,0 | 4.04 | 3,16 milhões | 111 | 6,0 |
Pelee-YOLOv3 [1] | 416x416 | 45,3 | 5.06 | 3,91 milhões | 115 | 5.5 |
Pelee-FPN [4] | 416x416 | 45,7 | 4,84 | 3,75 milhões | 115 | 5.8 |
Pelee-PRN-3l | 416x416 | 46,3 | 5.03 | 3,36 milhões | ||
mPelee-PRN | 416x416 | 46,8 | 4,76 | 3,81 milhões | 104 |
[1] Redmon, J. e Farhadi, A. (2018). Yolov3: Uma melhoria incremental. Pré-impressão do arXiv arXiv:1804.02767.
[2] Tan, M. e Le, QV (2019). EfficientNet: Repensando o dimensionamento de modelos para redes neurais convolucionais. Pré-impressão do arXiv arXiv:1905.11946.
[3] Wang, RJ, Li, X., & Ling, CX (2018). Pelee: Um sistema de detecção de objetos em tempo real em dispositivos móveis. Em Avanços em Sistemas de Processamento de Informação Neural (pp. 1963-1972).
[4] Lin, TY, Dollár, P., Girshick, R., He, K., Hariharan, B., & Belongie, S. (2017). Apresentam redes em pirâmide para detecção de objetos. Nos Anais da Conferência IEEE sobre Visão Computacional e Reconhecimento de Padrões (pp. 2117-2125).
https://github.com/AlexeyAB/darknet