이것은 종이에 대한 코드입니다
교통 표지판 감지 시스템을 위한 심층 신경망 평가
알바로 아르코스-가르시아, 후안 안토니오 알바레스-가르시아, 루이스 M. 소리아-모리요
이 논문은 다양한 특징 추출기(Resnet V1 50, Resnet V1 101, Inception V2, Inception Resnet V2, Mobilenet V1 및 Darknet-19). 우리는 전이 학습을 통해 교통 표지판 감지 문제 영역에 맞게 수정되고 특별히 조정된 이러한 객체 감지 모델의 속성을 탐색하는 것을 목표로 합니다. 특히, Microsoft COCO 데이터 세트에서 사전 훈련된 공개적으로 사용 가능한 다양한 객체 감지 모델은 독일 교통 표지판 감지 벤치마크 데이터 세트에서 미세 조정되었습니다. 이러한 모델의 평가 및 비교에는 평균 평균 정밀도(mAP), 메모리 할당, 실행 시간, 부동 소수점 연산 수, 모델 매개변수 수, 교통 표지판 이미지 크기 효과와 같은 주요 지표가 포함됩니다.
우리는 다음을 제공합니다:
이 코드가 연구에 유용하다고 생각되면 다음을 인용해 주세요.
"Evaluation of deep neural networks for traffic sign detection systems."
Álvaro Arcos-García, Juan A. Álvarez-García, Luis M. Soria-Morillo. Neurocomputing 316 (2018) 332-344.
[링크][빕텍스]
이 프로젝트는 Tensorflow에서 구현되며 Tensorflow ObjectDetection API와 darkflow라는 두 가지 저장소를 기반으로 합니다.
Google Drive에서 GTSDB 데이터세트의 TFRecord를 다운로드할 수 있습니다. gtsdb_data
폴더에 압축을 풀어주세요. Google Drive에서 사전 훈련된 모델을 다운로드할 수 있습니다. models
폴더에 압축을 풀어주세요.
우리의 연구 결과에 따르면 Faster R-CNN Inception Resnet V2는 최고의 mAP를 얻는 반면, R-FCN Resnet 101은 정확도와 실행 시간 사이에서 최고의 균형을 유지합니다. YOLO V2와 SSD Mobilenet은 전자가 경쟁력 있는 정확도 결과를 달성하고 두 번째로 빠른 탐지기라는 점에서 특별히 언급할 가치가 있습니다. 반면 후자는 메모리 소비 측면에서 가장 빠르고 가벼운 모델이므로 배포를 위한 최적의 선택이 됩니다. 모바일 및 임베디드 장치.
모델 | 지도 | 매개변수 | 슬리퍼 | memory_mb | total_exec_millis | accelerator_exec_millis | CPU_exec_millis |
---|---|---|---|---|---|---|---|
더 빠른 R-CNN Resnet 50 | 91.52 | 43337242 | 533575386662 | 5256.454615 | 104.0363553 | 75.93395395 | 28.10240132 |
더 빠른 R-CNN Resnet 101 | 95.08 | 62381593 | 625779295782 | 6134.705805 | 123.2729175 | 90.33714433 | 32.9357732 |
더 빠른 R-CNN 시작 V2 | 90.62 | 12891249 | 120621363525 | 2175.206857 | 58.53338971 | 38.76813971 | 19.76525 |
더 빠른 R-CNN Inception Resnet V2 | 95.77 | 59412281 | 1837544257834 | 18250.446008 | 442.2206796 | 366.1586796 | 76062 |
R-FCN 레즈넷 101 | 95.15 | 64594585 | 269898731281 | 3509.75153 | 85.45207971 | 52.40321739 | 33.04886232 |
SSD 모바일넷 | 61.64 | 5572809 | 2300721483 | 94.696119 | 15.14525 | 4.021267857 | 11.12398214 |
SSD 인셉션 V2 | 66.10 | 13474849 | 7594247747 | 284.512918 | 23.74428378 | 9.393405405 | 14.35087838 |
욜로 V2 | 78.83 | 50588958 | 62780021160 | 1318.108256 | 21.4810122 | 18.13923171 | 3.341780488 |
모델 | 작은 | 중간 | 크기가 큰 |
---|---|---|---|
더 빠른 R-CNN Resnet 50 | 53.57 | 86.95 | 86.72 |
더 빠른 R-CNN Resnet 101 | 70.89 | 94.17 | 88.87 |
더 빠른 R-CNN 시작 V2 | 56.72 | 81.02 | 88.53 |
더 빠른 R-CNN Inception Resnet V2 | 68.60 | 86.62 | 82.10 |
R-FCN 레즈넷 101 | 60.37 | 82.03 | 79.56 |
SSD 모바일넷 | 13.22 | 55.32 | 82.06 |
SSD 인셉션 V2 | 26.85 | 64.71 | 78.76 |
욜로 V2 | 42.93 | 78.99 | 75.67 |
우리는 새로운 이미지에 대해 사전 훈련된 모델을 실행하기 위한 지침이 포함된 Jupyter Notebook을 제공합니다.
모델을 훈련시키는 데 필요한 구성 파일은 사전 훈련된 모델 섹션에서 다운로드할 수 있는 각 zip 파일에 포함되어 있습니다. tensorflow 및 darkflow의 기본 소스 코드가 최소한으로 변경되었으므로 앞서 언급한 저장소의 마지막 버전을 사용하여 결과를 재현할 수 있어야 합니다. 예를 들어, SDD Mobilenet 모델을 훈련하려면 다음 명령행을 실행할 수 있습니다.
cd ~ /tensorflow/models/research
python3 object_detection/train.py --logtostderr --pipeline_config_path models/ssd_mobilenet_v1/ssd_mobilenet_v1_gtsdb3.config --train_dir models/ssd_mobilenet_v1/train/
사전 학습된 모델에서 얻은 결과를 평가하기 위한 지침이 포함된 Jupyter Notebook을 제공합니다.
이 프로젝트의 소스 코드는 주로 Tensorflow ObjectDetection API와 darkflow를 기반으로 합니다.