[Artigo] AI-TOD é um conjunto de dados para detecção de pequenos objetos em imagens aéreas.
[Conjunto de dados] Baixe o conjunto de treinamento xView e AI-TOD_wo_xview para construir o conjunto de dados AI-TOD completo!
AI-TOD vem com 700.621 instâncias de objetos para oito categorias em 28.036 imagens aéreas. Em comparação com os conjuntos de dados de detecção de objetos existentes em imagens aéreas, o tamanho médio dos objetos no AI-TOD é de cerca de 12,8 pixels, o que é muito menor que outros.
Você precisa baixar as duas partes a seguir (Parte 1: conjunto de treinamento xView, Parte 2: parte do AI-TOD) e usar nossa ferramenta de síntese ponta a ponta para gerar o conjunto de dados AI-TOD completo. (Observe que liberamos as anotações completas do AI-TOD, você só precisa gerar imagens )
Etapa 1: Baixe o conjunto de treinamento xView, AI-TOD sem xview, e clone o aitodtoolkit.
git clone https://github.com/jwwangchn/AI-TOD.git
Passo 2: Organize os arquivos baixados da seguinte maneira.
├─aitod
│ ├─annotations ## put the downloaded annotations of AI-TOD_wo_xview (.json)
│ └─images ## unzip the downloaded AI-TOD_wo_xview image sets, put them (.png) in the corresponding folder
│ ├─test ## directly put the images in it without extra folder
│ ├─train
│ ├─trainval
│ └─val
├─aitod_xview ## here are six files (.txt)
├─xview
│ ├─ori
│ │ └─train_images ## unzip the downloaded xView training set images, put them (.tif) here
│ └─xView_train.geojson ## the annotation file of xView training set
└─generate_aitod_imgs.py ## end-to-end tool
Etapa 3: Instale os pacotes necessários.
git clone https://github.com/jwwangchn/wwtool.git
cd wwtool
python setup.py develop
cd ..
cd aitodtoolkit
pip install -r requirements.txt
Passo 4: Execute o aitodtoolkit E2E e obtenha o AI-TOD, pode levar cerca de uma hora, então os conjuntos completos de imagens do AI-TOD podem ser encontrados na pasta aitod . E você pode excluir outros arquivos em outras pastas para não ocupar muito espaço.
python generate_aitod_imgs.py
Os conjuntos de treinamento, validação e teste já estão disponíveis publicamente. Relatamos o desempenho do estilo COCO no artigo original. Você pode usar o cocoapi-aitod para avaliar o desempenho do modelo.
Se você usar este conjunto de dados em sua pesquisa, considere citar esses artigos.
@inproceedings{AI-TOD_2020_ICPR,
title={Tiny Object Detection in Aerial Images},
author={Wang, Jinwang and Yang, Wen and Guo, Haowen and Zhang, Ruixiang and Xia, Gui-Song},
booktitle=ICPR,
pages={3791--3798},
year={2021},
}
@article{NWD_2021_arXiv,
title={A Normalized Gaussian Wasserstein Distance for Tiny Object Detection},
author={Wang, Jinwang and Xu, Chang and Yang, Wen and Yu, Lei},
journal={arXiv preprint arXiv:2110.13389},
year={2021}
}
Conjunto de dados xView
O conjunto de dados AI-TOD é licenciado sob a Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0). Assim, o conjunto de dados AI-TOD está disponível gratuitamente para fins acadêmicos ou pesquisas individuais, mas restrito para uso comercial. Além disso, os códigos subjacentes são licenciados sob a licença do MIT.