Il s'agit de la mise en œuvre de « Enrichissement de la variété des informations d'apprentissage par couche par combinaison de dégradés » à l'aide du framework Darknet.
Notre article paraîtra lors de l'atelier ICCV 2019 sur la vision par ordinateur à faible consommation.
Pour installer le framework Darknet, vous pouvez vous référer à darknet(pjreddie) ou darknet(AlexeyAB).
Nous fournissons le fichier cfg YOLO-v3-tiny-PRN et le modèle pré-entraîné COCO. Vous pouvez utiliser les fichiers fournis pour obtenir les résultats suivants sur l'ensemble de test-dev COCO :
Modèle | [email protected] | BFLOP | # Paramètre | FPS GPU | FPS du processeur |
---|---|---|---|---|---|
YOLO-v3-minuscule [1] | 33.1 | 5.571 | 8,86 millions | 300 | 8 |
YOLO-v3-tiny-PRN | 33.1 | 3.467 | 4,95 millions | 370 | 13 |
Nous fournissons également un fichier cfg et un modèle pré-entraîné COCO pour le backbone morden EfficientNet_b0 [2]. Pour entraîner ce modèle, vous devez installer darknet (AlexeyAB).
Modèle | Taille | [email protected] | BFLOP |
---|---|---|---|
EfficaceNet_b0-PRN | 416x416 | 45,5 | 3.730 |
EfficaceNet_b0-PRN | 320x320 | 41,0 | 2.208 |
Nous fournissons ici quelques résultats expérimentaux sur l'ensemble de test-dev COCO qui ne sont pas répertoriés dans l'article.
Modèle | Taille | [email protected] | BFLOP | # Paramètre |
---|---|---|---|---|
Pelée [3] | 304x304 | 38.3 | 2,58 | 5,98 millions |
Pelée-PRN | 320x320 | 40,9 | 2,39 | 3,16 millions |
Pelée-YOLOv3 [1] | 320x320 | 41.4 | 2,99 | 3,91 millions |
Pelée-FPN [4] | 320x320 | 41.4 | 2,86 | 3,75M |
Pelée-PRN-3l | 320x320 | 42,5 | 3,98 | 3,36 millions |
mPelée-PRN | 320x320 | 42,7 | 2,82 | 3,81M |
Modèle | Taille | [email protected] | BFLOP | # Paramètre | FPS GPU | FPS du processeur |
---|---|---|---|---|---|---|
Pelée-PRN | 416x416 | 45,0 | 4.04 | 3,16 millions | 111 | 6.0 |
Pelée-YOLOv3 [1] | 416x416 | 45.3 | 5.06 | 3,91 millions | 115 | 5.5 |
Pelée-FPN [4] | 416x416 | 45,7 | 4,84 | 3,75M | 115 | 5.8 |
Pelée-PRN-3l | 416x416 | 46.3 | 5.03 | 3,36 millions | ||
mPelée-PRN | 416x416 | 46,8 | 4,76 | 3,81M | 104 |
[1] Redmon, J. et Farhadi, A. (2018). Yolov3 : Une amélioration progressive. Préimpression arXiv arXiv:1804.02767.
[2] Tan, M. et Le, QV (2019). EfficientNet : repenser la mise à l'échelle du modèle pour les réseaux de neurones convolutifs. Préimpression arXiv arXiv:1905.11946.
[3] Wang, RJ, Li, X. et Ling, CX (2018). Pelée : Un système de détection d'objets en temps réel sur les appareils mobiles. Dans Advances in Neural Information Processing Systems (pp. 1963-1972).
[4] Lin, TY, Dollár, P., Girshick, R., He, K., Hariharan, B. et Belongie, S. (2017). Réseaux pyramidaux de fonctionnalités pour la détection d'objets. Dans Actes de la conférence IEEE sur la vision par ordinateur et la reconnaissance de formes (pp. 2117-2125).
https://github.com/AlexeyAB/darknet