iresnet
1.0.0
이것은 "이미지 및 비디오 인식을 위한 개선된 잔여 네트워크" 논문의 PyTorch 구현입니다.
@article{duta2020improved,
author = {Ionut Cosmin Duta and Li Liu and Fan Zhu and Ling Shao},
title = {Improved Residual Networks for Image and Video Recognition},
journal = {arXiv preprint arXiv:2004.04989},
year = {2020},
}
ImageNet에서 훈련된 모델은 여기에서 찾을 수 있습니다.
iResNet(개선된 잔차 네트워크)은 매개변수 수와 계산 비용을 늘리지 않고도 인식 성능 측면에서 기준선(ResNet)을 향상시킬 수 있습니다. iResNet은 매우 심층적인 모델을 훈련하는 데 매우 효과적입니다(자세한 내용은 논문 참조).
ImageNet의 정확도(기본 교육 설정 사용):
회로망 | 50층 | 101층 | 152층 | 200층 |
---|---|---|---|---|
레스넷 | 76.12% (모델) | 78.00% (모델) | 78.45% (모델) | 77.55% (모델) |
아이레스넷 | 77.31 % (모델) | 78.64 % (모델) | 79.34 % (모델) | 79.48 % (모델) |
공식 PyTorch ImageNet 교육 코드에 따라 PyTorch 및 ImageNet 데이터세트를 설치합니다.
빠른 대안(PyTorch 및 기타 딥 러닝 라이브러리를 설치할 필요 없음)은 NVIDIA-Docker를 사용하는 것입니다. 우리는 이 컨테이너 이미지를 사용했습니다.
DataParallel을 사용하여 모델(예: 50개의 레이어가 있는 iResNet)을 훈련하려면 main.py
실행하세요. result_path
(결과와 로그를 저장할 디렉터리 경로) 및 --data
(ImageNet 데이터세트 경로)도 제공해야 합니다.
result_path=/your/path/to/save/results/and/logs/
mkdir -p ${result_path}
python main.py
--data /your/path/to/ImageNet/dataset/
--result_path ${result_path}
--arch iresnet
--model_depth 50
다중 처리 분산 데이터 병렬 훈련을 사용하여 훈련하려면 공식 PyTorch ImageNet 훈련 코드의 지침을 따르십시오.