Общий метод поиска рецептивного поля для CNN. Если в вашей сети есть Conv с ядром больше 1, RF-Next может еще больше улучшить вашу модель. Официальная реализация:
Документ TPAMI2022: «RF-Next: эффективный поиск рецептивных полей для сверточных нейронных сетей»
Документ CVPR2021: «Global2Local: эффективный поиск структуры для сегментации видеодействий»
Временные/пространственные рецептивные поля моделей играют важную роль в последовательных/пространственных задачах. Большие восприимчивые поля способствуют долгосрочным отношениям, а малые восприимчивые поля помогают уловить местные детали. Существующие методы создают модели с вручную созданными рецептивными полями в слоях. Можем ли мы эффективно искать комбинации восприимчивых полей, чтобы заменить шаблоны, созданные вручную? Чтобы ответить на этот вопрос, мы предлагаем найти лучшие комбинации восприимчивых полей с помощью схемы поиска от глобального к локальному. Наша схема поиска использует как глобальный поиск для поиска грубых комбинаций, так и локальный поиск для дальнейшего получения уточненных комбинаций восприимчивых полей. Глобальный поиск находит возможные грубые комбинации, отличные от шаблонов, созданных человеком. Помимо глобального поиска, мы предлагаем итеративную схему локального поиска, основанную на ожиданиях, для эффективного уточнения комбинаций. Наши модели RF-Next, подключающие поиск рецептивных полей к различным моделям, повышают производительность при выполнении многих задач, например, сегментации временных действий, обнаружения объектов, сегментации экземпляров и синтеза речи.
RF-Next поддерживает множество приложений.
Если вы считаете, что эта работа или код полезны в вашем исследовании, укажите:
@article{gao2022rfnext,
title={RF-Next: Efficient Receptive Field Search for Convolutional Neural Networks},
author={Gao, Shanghua and Li, Zhong-Yu and Han, Qi and Cheng, Ming-Ming and Wang, Liang},
journal=TPAMI,
year={2022} }
@inproceedings{gao2021global2local,
title={Global2Local: Efficient Structure Search for Video Action Segmentation},
author={Gao, Shang-Hua and Han, Qi and Li, Zhong-Yu and Peng, Pai and Wang, Liang and Cheng, Ming-Ming},
booktitle=CVPR,
year={2021}
}
Исходный код бесплатен только для использования в исследованиях и образовательных целях. Любое коммерческое использование должно сначала получить официальное разрешение.
Если у вас есть какие-либо вопросы, пишите Шан-Хуа Гао по электронной почте ( shgao(at)live.com
)