[Papier] AI-TOD ist ein Datensatz zur Erkennung winziger Objekte in Luftbildern.
[Datensatz] Bitte laden Sie das xView-Trainingsset und AI-TOD_wo_xview herunter, um den vollständigen AI-TOD-Datensatz zu erstellen!
AI-TOD verfügt über 700.621 Objektinstanzen für acht Kategorien in 28.036 Luftbildern. Im Vergleich zu vorhandenen Objekterkennungsdatensätzen in Luftbildern beträgt die durchschnittliche Größe von Objekten in AI-TOD etwa 12,8 Pixel und ist damit viel kleiner als bei anderen.
Sie müssen die folgenden zwei Teile herunterladen (Teil 1: xView-Trainingsset, Teil 2: Teil von AI-TOD) und unser End-to-End-Synthesetool verwenden, um den vollständigen AI-TOD-Datensatz zu generieren. (Beachten Sie, dass wir die vollständigen Anmerkungen von AI-TOD veröffentlicht haben. Sie müssen nur Bilder generieren .)
Schritt 1: Laden Sie das xView-Trainingsset AI-TOD ohne xview herunter und klonen Sie das aitodtoolkit.
git clone https://github.com/jwwangchn/AI-TOD.git
Schritt 2: Organisieren Sie die heruntergeladenen Dateien wie folgt.
├─aitod
│ ├─annotations ## put the downloaded annotations of AI-TOD_wo_xview (.json)
│ └─images ## unzip the downloaded AI-TOD_wo_xview image sets, put them (.png) in the corresponding folder
│ ├─test ## directly put the images in it without extra folder
│ ├─train
│ ├─trainval
│ └─val
├─aitod_xview ## here are six files (.txt)
├─xview
│ ├─ori
│ │ └─train_images ## unzip the downloaded xView training set images, put them (.tif) here
│ └─xView_train.geojson ## the annotation file of xView training set
└─generate_aitod_imgs.py ## end-to-end tool
Schritt 3: Erforderliche Pakete installieren.
git clone https://github.com/jwwangchn/wwtool.git
cd wwtool
python setup.py develop
cd ..
cd aitodtoolkit
pip install -r requirements.txt
Schritt 4: Führen Sie das E2E aitodtoolkit aus und holen Sie sich AI-TOD. Es kann etwa eine Stunde dauern. Dann finden Sie die vollständigen Bildsätze von AI-TOD im Ordner aitod . Und Sie können andere Dateien in anderen Ordnern löschen, um zu vermeiden, dass sie zu viel Speicherplatz beanspruchen.
python generate_aitod_imgs.py
Trainings-, Validierungs- und Testsets sind jetzt öffentlich verfügbar. Wir berichten über die Leistung des COCO-Stils im Originalpapier. Sie können den Cocoapi-Aitod verwenden, um die Modellleistung zu bewerten.
Wenn Sie diesen Datensatz in Ihrer Forschung verwenden, denken Sie bitte darüber nach, diese Artikel zu zitieren.
@inproceedings{AI-TOD_2020_ICPR,
title={Tiny Object Detection in Aerial Images},
author={Wang, Jinwang and Yang, Wen and Guo, Haowen and Zhang, Ruixiang and Xia, Gui-Song},
booktitle=ICPR,
pages={3791--3798},
year={2021},
}
@article{NWD_2021_arXiv,
title={A Normalized Gaussian Wasserstein Distance for Tiny Object Detection},
author={Wang, Jinwang and Xu, Chang and Yang, Wen and Yu, Lei},
journal={arXiv preprint arXiv:2110.13389},
year={2021}
}
xView-Datensatz
Der AI-TOD-Datensatz ist unter der Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) lizenziert. Daher sind AI-TOD-Datensätze für akademische Zwecke oder individuelle Forschung frei verfügbar, für die kommerzielle Nutzung jedoch eingeschränkt. Darüber hinaus sind die zugrunde liegenden Codes unter der MIT-Lizenz lizenziert.