これは論文のコードです
交通標識検出システム用ディープニューラルネットワークの評価
アルバロ・アルコス=ガルシア、フアン・アントニオ・アルバレス=ガルシア、ルイス・M・ソリア=モリージョ
この論文では、さまざまな特徴抽出器 (Resnet V1 50、Resnet V1 50、 Resnet V1 101、Inception V2、Inception Resnet V2、Mobilenet V1、および Darknet-19)。我々は、転移学習によって交通標識検出の問題領域に修正され、特に適応されたこれらの物体検出モデルの特性を調査することを目的としています。特に、Microsoft COCO データセットで事前トレーニングされた、公開されているさまざまな物体検出モデルは、ドイツの交通標識検出ベンチマーク データセットで微調整されています。これらのモデルの評価と比較には、平均平均精度 (mAP)、メモリ割り当て、実行時間、浮動小数点演算の数、モデルのパラメーターの数、交通標識の画像サイズの影響などの重要な指標が含まれます。
私たちは以下を提供します:
このコードが研究に役立つと思われる場合は、引用してください。
"Evaluation of deep neural networks for traffic sign detection systems."
Álvaro Arcos-García, Juan A. Álvarez-García, Luis M. Soria-Morillo. Neurocomputing 316 (2018) 332-344.
[リンク][ビブテックス]
このプロジェクトは Tensorflow で実装されており、Tensorflow Object Detection API と darkflow という 2 つのリポジトリに基づいています。
GTSDB データセットの TFRecord は Google ドライブからダウンロードできます。 gtsdb_data
フォルダーに解凍します。事前トレーニングされたモデルは Google ドライブからダウンロードできます。これらをmodels
フォルダーに解凍します。
私たちの調査結果は、より高速な R-CNN Inception Resnet V2 が最良の mAP を取得するのに対し、R-FCN Resnet 101 は精度と実行時間の間で最良のトレードオフを実現していることを示しています。 YOLO V2 と SSD Mobilenet は特筆に値します。前者は競合する精度の結果を達成し、2 番目に速い検出器であるのに対し、後者はメモリ消費量の点で最速かつ最軽量のモデルであるため、次のような環境での展開に最適です。モバイルおよび組み込みデバイス。
モデル | 地図 | パラメータ | フロップ | メモリ_mb | total_exec_millis | アクセラレータ_exec_millis | cpu_exec_millis |
---|---|---|---|---|---|---|---|
より高速な R-CNN Resnet 50 | 91.52 | 43337242 | 533575386662 | 5256.454615 | 104.0363553 | 75.93395395 | 28.10240132 |
より高速な R-CNN Resnet 101 | 95.08 | 62381593 | 625779295782 | 6134.705805 | 123.2729175 | 90.33714433 | 32.9357732 |
より高速な R-CNN インセプション V2 | 90.62 | 12891249 | 120621363525 | 2175.206857 | 58.53338971 | 38.76813971 | 19.76525 |
高速化された R-CNN インセプション Resnet V2 | 95.77 | 59412281 | 1837544257834 | 18250.446008 | 442.2206796 | 366.1586796 | 76062 |
R-FCN レスネット 101 | 95.15 | 64594585 | 269898731281 | 3509.75153 | 85.45207971 | 52.40321739 | 33.04886232 |
SSDモバイルネット | 61.64 | 5572809 | 2300721483 | 94.696119 | 15.14525 | 4.021267857 | 11.12398214 |
SSD インセプション V2 | 66.10 | 13474849 | 7594247747 | 284.512918 | 23.74428378 | 9.393405405 | 14.35087838 |
ヨロV2 | 78.83 | 50588958 | 62780021160 | 1318.108256 | 21.4810122 | 18.13923171 | 3.341780488 |
モデル | 小さい | 中くらい | 大きい |
---|---|---|---|
より高速な R-CNN Resnet 50 | 53.57 | 86.95 | 86.72 |
より高速な R-CNN Resnet 101 | 70.89 | 94.17 | 88.87 |
より高速な R-CNN インセプション V2 | 56.72 | 81.02 | 88.53 |
高速化された R-CNN インセプション Resnet V2 | 68.60 | 86.62 | 82.10 |
R-FCN レスネット 101 | 60.37 | 82.03 | 79.56 |
SSDモバイルネット | 22.13 | 55.32 | 82.06 |
SSD インセプション V2 | 26.85 | 64.71 | 78.76 |
ヨロV2 | 42.93 | 78.99 | 75.67 |
新しいイメージで事前トレーニングされたモデルを実行する手順を記載した Jupyter Notebook を提供します。
モデルのトレーニングに必要な構成ファイルは、事前トレーニングされたモデルのセクションからダウンロードできる各 zip ファイル内に含まれています。 tensorflow と darkflow のベース ソース コードには最小限の変更が加えられているため、前述のリポジトリの最新バージョンを使用して結果を再現できるはずです。たとえば、SDD Mobilenet モデルをトレーニングするには、次のコマンド ラインを実行できます。
cd ~ /tensorflow/models/research
python3 object_detection/train.py --logtostderr --pipeline_config_path models/ssd_mobilenet_v1/ssd_mobilenet_v1_gtsdb3.config --train_dir models/ssd_mobilenet_v1/train/
事前トレーニングされたモデルによって得られた結果を評価するための手順を備えた Jupyter Notebook を提供します。
このプロジェクトのソース コードは主に Tensorflow Object Detection API と darkflow に基づいています。