다크넷 프레임워크를 활용한 "그라데이션 조합을 통한 레이어별 학습 정보의 다양성 강화"를 구현한 것입니다.
우리 논문은 2019 ICCV 저전력 컴퓨터 비전 워크숍에 게재될 예정입니다.
다크넷 프레임워크 설치는 darknet(pjreddie)나 darknet(AlexeyAB)을 참고하시면 됩니다.
YOLO-v3-tiny-PRN cfg 파일과 COCO 사전 학습 모델을 제공합니다. 제공된 파일을 사용하여 COCO 테스트 개발 세트에서 다음 결과를 얻을 수 있습니다.
모델 | [email protected] | BFLOP | # 매개변수 | GPU FPS | CPU FPS |
---|---|---|---|---|---|
YOLO-v3-tiny [1] | 33.1 | 5.571 | 886만 | 300 | 8 |
YOLO-v3-tiny-PRN | 33.1 | 3.467 | 495만 | 370 | 13 |
또한 최신 백본 EfficientNet_b0 [2]에 대한 cfg 파일과 COCO 사전 학습 모델을 제공합니다. 이 모델을 훈련하려면 darknet(AlexeyAB)을 설치해야 합니다.
모델 | 크기 | [email protected] | BFLOP |
---|---|---|---|
EfficientNet_b0-PRN | 416x416 | 45.5 | 3.730 |
EfficientNet_b0-PRN | 320x320 | 41.0 | 2.208 |
여기에서는 논문에 나열되지 않은 COCO 테스트 개발 세트에 대한 몇 가지 실험 결과를 제공합니다.
모델 | 크기 | [email protected] | BFLOP | # 매개변수 |
---|---|---|---|---|
펠리 [3] | 304x304 | 38.3 | 2.58 | 598M |
펠리-PRN | 320x320 | 40.9 | 2.39 | 316만 |
펠리-YOLOv3 [1] | 320x320 | 41.4 | 2.99 | 391만 |
펠리-FPN [4] | 320x320 | 41.4 | 2.86 | 375만 |
펠리-PRN-3l | 320x320 | 42.5 | 3.98 | 336만 |
mPelee-PRN | 320x320 | 42.7 | 2.82 | 381만 |
모델 | 크기 | [email protected] | BFLOP | # 매개변수 | GPU FPS | CPU FPS |
---|---|---|---|---|---|---|
펠리-PRN | 416x416 | 45.0 | 4.04 | 316만 | 111 | 6.0 |
펠리-YOLOv3 [1] | 416x416 | 45.3 | 5.06 | 391만 | 115 | 5.5 |
펠리-FPN [4] | 416x416 | 45.7 | 4.84 | 375만 | 115 | 5.8 |
펠리-PRN-3l | 416x416 | 46.3 | 5.03 | 336만 | ||
mPelee-PRN | 416x416 | 46.8 | 4.76 | 381만 | 104 |
[1] Redmon, J., & Farhadi, A. (2018). Yolov3: 점진적인 개선입니다. arXiv 사전 인쇄 arXiv:1804.02767.
[2] Tan, M., & Le, QV(2019). EfficientNet: 컨볼루셔널 신경망에 대한 모델 스케일링 재고. arXiv 사전 인쇄 arXiv:1905.11946.
[3] 왕, RJ, Li, X., & Ling, CX(2018). Pelee: 모바일 장치의 실시간 객체 감지 시스템입니다. 신경 정보 처리 시스템의 발전(pp. 1963-1972).
[4] Lin, TY, Dollár, P., Girshick, R., He, K., Hariharan, B., & Belongie, S. (2017). 객체 감지를 위한 피라미드 네트워크 기능을 제공합니다. 컴퓨터 비전 및 패턴 인식에 관한 IEEE 회의 진행 중(pp. 2117-2125).
https://github.com/AlexeyAB/darknet