git clone https://github.com/Dreemurr-T/BAID.git
cd BAID/
pip install pandas
pip install tqdm
python downloading_script/download.py
Les images seront enregistrées en images/
dossiers.
Puisqu'il pourrait être lent lors du téléchargement des images, nous fournissons des alternatives pour obtenir l'ensemble de données:
Les étiquettes de fil de données de l'ensemble de données se trouvent dans le dossier dataset
.
D'autres dépendances peuvent être installées avec:
pip install -r requirements.txt
images/
dossiers python pretraining_utils/pretrain_mani.py
python pretraining.py
L'ensemble du processus de pré-formation prend environ 2 jours sur un seul RTX3090. Nous fournissons nos poids pré-entraînés à Drive.
Pour une formation sur Baid, utilisation:
python train.py
Les points de contrôle seront enregistrés sur le dossier checkpoint/SAAN
.
Pour tester sur Baid, téléchargez les poids pré-entraînés à partir de Drive, placez le point de contrôle dans checkpoint/BAID
Puis utilisez:
python test.py
L'ensemble de données est sous licence sous CC BY-NC-ND 4.0
Le code a emprunté à pytorch-adain et non local_pytorch.
Si vous trouvez notre travail utile, veuillez citer notre travail comme:
@InProceedings { Yi_2023_CVPR ,
author = { Yi, Ran and Tian, Haoyuan and Gu, Zhihao and Lai, Yu-Kun and Rosin, Paul L. } ,
title = { Towards Artistic Image Aesthetics Assessment: A Large-Scale Dataset and a New Method } ,
booktitle = { Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) } ,
month = { June } ,
year = { 2023 } ,
pages = { 22388-22397 }
}