pyconvダウンロード - pyconvソースコードのダウンロード

pyconv

AI ソースコード

1.0.0

ダウンロード

ピラミッド畳み込み

これは、論文「ピラミッド畳み込み: 視覚認識のための畳み込みニューラルネットワークの再考」の PyTorch 実装です。 (これは ImageNet 上の画像認識用のコードであることに注意してください。セマンティックな画像のセグメンテーション/解析については、このリポジトリを参照してください: https://github.com/iduta/pyconvsegnet)

ピラミッド畳み込み: PyConv

ImageNet でトレーニングされたモデルはここにあります。

PyConv は、ベースラインよりも向上した認識機能を提供できます (詳細については論文を参照してください)。

ImageNet での精度 (デフォルトのトレーニング設定を使用):

ネットワーク	50層	101層	152層
レスネット	76.12% (モデル)	78.00%(モデル)	78.45% (モデル)
PyConvHGResNet	78.48 %(モデル)	79.22 %(モデル)	79.36 %(モデル)
PyConvResNet	77.88 %(モデル)	79.01 %(モデル)	79.52 %(モデル)

ImageNet の精度は、より複雑なトレーニング設定 (たとえば、追加のデータ拡張 (CutMix) の使用、バッチサイズを 1024 に増加、学習率 0.4、300 エポック以上のコサインスケジューラ、混合精度を使用してトレーニングを高速化するなど) を使用して大幅に改善できます。 ):

ネットワーク	テスト作物：224×224	テスト作物：320×320
PyConvResNet-50 (+拡張)	79.44	80.59	（モデル）
PyConvResNet-101 (+拡張)	80.58	81.49	（モデル）

要件

公式の PyTorch ImageNet トレーニングコードに従って、PyTorch と ImageNet データセットをインストールします。

迅速な代替方法 (PyTorch やその他のディープラーニングライブラリをインストールする必要がない) は、NVIDIA-Docker を使用することです。このコンテナイメージを使用しました。

トレーニング

DataParallel を使用してモデル (たとえば、50 層の PyConvResNet) をトレーニングするには、 main.pyを実行します。 result_path (結果とログを保存するディレクトリパス) と--data (ImageNet データセットへのパス) も指定する必要があります。

result_path=/your/path/to/save/results/and/logs/
mkdir -p ${result_path}
python main.py 
--data /your/path/to/ImageNet/dataset/ 
--result_path ${result_path} 
--arch pyconvresnet 
--model_depth 50

マルチプロセス分散データ並列トレーニングを使用してトレーニングするには、公式の PyTorch ImageNet トレーニングコードの指示に従ってください。

引用

私たちの取り組みが役立つと思われる場合は、以下を引用することを検討してください。

 @article{duta2020pyramidal,
  author  = {Ionut Cosmin Duta and Li Liu and Fan Zhu and Ling Shao},
  title   = {Pyramidal Convolution: Rethinking Convolutional Neural Networks for Visual Recognition},
  journal = {arXiv preprint arXiv:2006.11538},
  year    = {2020},
}

拡大する

追加情報