[論文] AI-TOD は、航空画像内の微小な物体を検出するためのデータセットです。
[データセット] 完全な AI-TOD データセットを構築するには、xView トレーニング セットと AI-TOD_wo_xview をダウンロードしてください。
AI-TOD には、28,036 枚の航空写真にわたる 8 つのカテゴリの 700,621 個のオブジェクト インスタンスが付属しています。航空画像の既存の物体検出データセットと比較すると、AI-TOD の物体の平均サイズは約 12.8 ピクセルで、他のものよりもはるかに小さくなります。
次の 2 つの部分 (パート 1: xView トレーニング セット、パート 2: AI-TOD の一部) をダウンロードし、エンドツーエンド合成ツールを使用して完全な AI-TOD データセットを生成する必要があります。 (AI-TOD の完全なアノテーションがリリースされていることに注意してください。必要なのは画像を生成するだけです)
ステップ 1: xView トレーニング セット、xview なしの AI-TOD をダウンロードし、aitodtoolkit を複製します。
git clone https://github.com/jwwangchn/AI-TOD.git
ステップ 2:ダウンロードしたファイルを次の方法で整理します。
├─aitod
│ ├─annotations ## put the downloaded annotations of AI-TOD_wo_xview (.json)
│ └─images ## unzip the downloaded AI-TOD_wo_xview image sets, put them (.png) in the corresponding folder
│ ├─test ## directly put the images in it without extra folder
│ ├─train
│ ├─trainval
│ └─val
├─aitod_xview ## here are six files (.txt)
├─xview
│ ├─ori
│ │ └─train_images ## unzip the downloaded xView training set images, put them (.tif) here
│ └─xView_train.geojson ## the annotation file of xView training set
└─generate_aitod_imgs.py ## end-to-end tool
ステップ 3:必要なパッケージをインストールします。
git clone https://github.com/jwwangchn/wwtool.git
cd wwtool
python setup.py develop
cd ..
cd aitodtoolkit
pip install -r requirements.txt
ステップ 4: E2E aitodtoolkit を実行して AI-TOD を取得します。これには約 1 時間かかる場合があります。その後、AI-TOD の完全なイメージ セットがaitodフォルダーに見つかります。また、スペースの占有を避けるために、他のフォルダー内の他のファイルを削除することもできます。
python generate_aitod_imgs.py
トレーニング、検証、テスト セットはいずれも現在公開されています。元の論文では COCO スタイルのパフォーマンスを報告しています。cocoapi-aitod を使用してモデルのパフォーマンスを評価できます。
このデータセットを研究で使用する場合は、これらの論文を引用することを検討してください。
@inproceedings{AI-TOD_2020_ICPR,
title={Tiny Object Detection in Aerial Images},
author={Wang, Jinwang and Yang, Wen and Guo, Haowen and Zhang, Ruixiang and Xia, Gui-Song},
booktitle=ICPR,
pages={3791--3798},
year={2021},
}
@article{NWD_2021_arXiv,
title={A Normalized Gaussian Wasserstein Distance for Tiny Object Detection},
author={Wang, Jinwang and Xu, Chang and Yang, Wen and Yu, Lei},
journal={arXiv preprint arXiv:2110.13389},
year={2021}
}
xView データセット
AI-TOD データセットは、表示 - 非営利 - 継承 4.0 インターナショナル (CC BY-NC-SA 4.0) に基づいてライセンスされています。したがって、AI-TOD データセットは学術目的または個人研究には自由に利用できますが、商業利用には制限されています。さらに、基礎となるコードは MIT ライセンスに基づいてライセンスされています。