制御可能なテキストから画像への生成データセット
ノア-悟空データセット
ゼロ: トピック主導の生成のためのテキストから画像への拡散モデルの微調整
Flickr 30k データセット
ビジュアルゲノムデータセット
概念的キャプション (CC) データセット
YFCC100M データセット
ALT200M データセット
LAION-400M データセット
LAION-5B データセット
Wikipedia ベースの画像テキスト (WIT) データセット Wikipedia ベースの画像テキスト (WIT) データセット
LAION-5B データセット
TaiSu (TaiSu - 10 億レベルの大規模中国語ビジュアル言語事前トレーニング データセット)
COYO-700M: 大規模な画像とテキストのペア データセット
WIT: Wikipedia に基づく画像テキスト データセット
拡散DB
# Get this repo
git clone https://github.com/nightrome/cocostuff.git
cd cocostuff
# Download everything
wget --directory-prefix=downloads http://images.cocodataset.org/zips/train2017.zip
wget --directory-prefix=downloads http://images.cocodataset.org/zips/val2017.zip
wget --directory-prefix=downloads http://calvin.inf.ed.ac.uk/wp-content/uploads/data/cocostuffdataset/stuffthingmaps_trainval2017.zip
# Unpack everything
mkdir -p dataset/images
mkdir -p dataset/annotations
unzip downloads/train2017.zip -d dataset/images/
unzip downloads/val2017.zip -d dataset/images/
unzip downloads/stuffthingmaps_trainval2017.zip -d dataset/annotations/
1. 下载hfd
wget https://hf-mirror.com/hfd/hfd.sh
chmod a+x hfd.sh
2. 设置环境变量
export HF_ENDPOINT=https://hf-mirror.com
3.1 下载模型
./hfd.sh gpt2 --tool aria2c -x 4
3.2 下载数据集
./hfd.sh yuvalkirstain/pickapic_v1 --dataset --tool aria2c -x 4
DeepFashion-マルチモーダル
ディープファッション
COCO (COCO キャプション) データセット
CUBS-2000-2021 データセット
102 カテゴリ花データセット
Flickr8k_dataset
Flickr8k_Dataset.zip https://github.com/jbrownlee/Datasets/releases/download/Flickr8k/Flickr8k_Dataset.zip
Flickr8k_text.zip https://github.com/jbrownlee/Datasets/releases/download/Flickr8k/Flickr8k_text.zip
名詞データセットはタイトルを名詞データセット カードに自動的に追加します
OxfordTVG-HIC データセット大規模ユーモア画像テキスト データセット
Multi-Modal-CelebA-HQ大規模な顔画像テキスト データセット