CNN의 일반적인 수용 필드 검색 방법. 네트워크에 커널이 1보다 큰 Conv가 있는 경우 RF-Next는 모델을 더욱 향상시킬 수 있습니다. 공식 구현:
TPAMI2022 논문: 'RF-Next: 컨볼루셔널 신경망을 위한 효율적인 수용 필드 검색'
CVPR2021 논문: 'Global2Local: 비디오 동작 분할을 위한 효율적인 구조 검색'
모델의 시간/공간 수용 필드는 순차/공간 작업에서 중요한 역할을 합니다. 큰 수용 필드는 장기적인 관계를 촉진하는 반면 작은 수용 필드는 로컬 세부 정보를 캡처하는 데 도움이 됩니다. 기존 방법은 레이어에 직접 디자인한 수용 필드를 사용하여 모델을 구성합니다. 손으로 디자인한 패턴을 대체하기 위해 수용 필드 조합을 효과적으로 검색할 수 있습니까? 이 질문에 대답하기 위해 우리는 전역-로컬 검색 체계를 통해 더 나은 수용 필드 조합을 찾을 것을 제안합니다. 우리의 검색 체계는 거친 조합을 찾기 위해 전역 검색과 세련된 수용 필드 조합을 더 많이 얻기 위해 지역 검색을 모두 활용합니다. 전역 검색은 인간이 디자인한 패턴 이외의 가능한 대략적인 조합을 찾습니다. 전역 검색 외에도 조합을 효과적으로 개선하기 위한 기대 기반 반복 지역 검색 기법을 제안합니다. 수용 필드 검색을 다양한 모델에 연결하는 RF-Next 모델은 시간적 동작 분할, 객체 감지, 인스턴스 분할 및 음성 합성과 같은 많은 작업의 성능을 향상시킵니다.
RF-Next는 다양한 애플리케이션을 지원합니다.
이 작업이나 코드가 연구에 도움이 된다면 다음을 인용해 주세요.
@article{gao2022rfnext,
title={RF-Next: Efficient Receptive Field Search for Convolutional Neural Networks},
author={Gao, Shanghua and Li, Zhong-Yu and Han, Qi and Cheng, Ming-Ming and Wang, Liang},
journal=TPAMI,
year={2022} }
@inproceedings{gao2021global2local,
title={Global2Local: Efficient Structure Search for Video Action Segmentation},
author={Gao, Shang-Hua and Han, Qi and Li, Zhong-Yu and Peng, Pai and Wang, Liang and Cheng, Ming-Ming},
booktitle=CVPR,
year={2021}
}
소스 코드는 연구 및 교육 용도로만 무료입니다. 모든 상업적 사용은 먼저 공식적인 허가를 받아야 합니다.
질문이 있으시면 언제든지 Shang-Hua Gao( shgao(at)live.com
)로 이메일을 보내주세요.