Это реализация «Расширения разнообразия послойной обучающей информации путем комбинирования градиентов» с использованием инфраструктуры Darknet.
Наша статья будет опубликована на семинаре ICCV по маломощному компьютерному зрению в 2019 году.
Для установки платформы Darknet вы можете обратиться к darknet(pjreddie) или darknet(AlexeyAB).
Мы предоставляем cfg-файл YOLO-v3-tiny-PRN и предварительно обученную модель COCO. Вы можете использовать предоставленные файлы, чтобы получить следующие результаты в наборе тестовой разработки COCO:
Модель | МАП@0,5 | БФЛОП | # Параметр | графический процессор | Частота кадров процессора |
---|---|---|---|---|---|
YOLO-v3-крошечный [1] | 33,1 | 5.571 | 8,86 млн. | 300 | 8 |
YOLO-v3-крошечный-PRN | 33,1 | 3,467 | 4,95 млн. | 370 | 13 |
Мы также предоставляем файл cfg и предварительно обученную модель COCO для современной магистральной сети EfficientNet_b0 [2]. Для обучения этой модели вам необходимо установить darknet (AlexeyAB).
Модель | Размер | МАП@0,5 | БФЛОП |
---|---|---|---|
EfficientNet_b0-PRN | 416x416 | 45,5 | 3.730 |
EfficientNet_b0-PRN | 320x320 | 41,0 | 2.208 |
Здесь мы приводим некоторые экспериментальные результаты на тестовом наборе COCO, которые не указаны в статье.
Модель | Размер | МАП@0,5 | БФЛОП | # Параметр |
---|---|---|---|---|
Пеле [3] | 304x304 | 38,3 | 2,58 | 5,98 млн. |
Пеле-ПРН | 320x320 | 40,9 | 2.39 | 3,16 млн. |
Пеле-YOLOv3 [1] | 320x320 | 41,4 | 2,99 | 3,91 млн. |
Пеле-ФПН [4] | 320x320 | 41,4 | 2,86 | 3,75 млн. |
Пеле-ПРН-3л | 320x320 | 42,5 | 3,98 | 3,36 млн. |
мПелее-ПРН | 320x320 | 42,7 | 2,82 | 3,81 млн. |
Модель | Размер | МАП@0,5 | БФЛОП | # Параметр | графический процессор | Частота кадров процессора |
---|---|---|---|---|---|---|
Пеле-ПРН | 416x416 | 45,0 | 4.04 | 3,16 млн. | 111 | 6.0 |
Пеле-YOLOv3 [1] | 416x416 | 45,3 | 5.06 | 3,91 млн. | 115 | 5,5 |
Пеле-ФПН [4] | 416x416 | 45,7 | 4,84 | 3,75 млн. | 115 | 5,8 |
Пеле-ПРН-3л | 416x416 | 46,3 | 5.03 | 3,36 млн. | ||
мПелее-ПРН | 416x416 | 46,8 | 4,76 | 3,81 млн. | 104 |
[1] Редмон Дж. и Фархади А. (2018). Йолов3: Постепенное улучшение. Препринт arXiv arXiv:1804.02767.
[2] Тан, М., и Ле, QV (2019). EfficientNet: переосмысление масштабирования модели для сверточных нейронных сетей. Препринт arXiv arXiv:1905.11946.
[3] Ван, Р.Дж., Ли, X. и Линг, CX (2018). Pelee: система обнаружения объектов в реальном времени на мобильных устройствах. В книге «Достижения в области нейронных систем обработки информации» (стр. 1963–1972).
[4] Лин Т.Я., Доллар П., Гиршик Р., Хе К., Харихаран Б. и Белонги С. (2017). Функциональные пирамидальные сети для обнаружения объектов. В материалах конференции IEEE по компьютерному зрению и распознаванию образов (стр. 2117-2125).
https://github.com/AlexeyAB/darknet