FFHQ-Wrinkle は FFHQ (Flickr-Faces-HQ) データセットの拡張機能であり、顔のしわに関連する追加の特徴を含めるように特別に設計されています。このデータセットは、顔認識、老化シミュレーション、およびその他の関連分野の研究開発をサポートすることを目的としています。
このデータセットを研究に使用する場合は、次の論文を引用してください。
更新予定
最初の公開された顔のしわデータセットである「FFHQ-Wrinkle」は、顔画像とそれに対応するしわマスクのペアで構成されています。私たちは、既存の高解像度の顔画像データセット FFHQ (Flickr-Faces-HQ) を利用しながら、しわのラベルに焦点を当てました。このデータセットには、さまざまな角度や照明条件で撮影された 70,000 の高解像度 (1024x1024) の顔画像が含まれています。私たちが提供するデータセットは、手動でラベル付けされた 1 セットのしわマスク (N=1,000) と、人間の労働なしで生成された 1 セットの「弱い」しわマスク、つまりマスクされたテクスチャ マップ (N=50,000) で構成されています。 FFHQ データセットから 50,000 枚の画像、具体的には画像 ID 00000 ~ 49999 を選択しました。これらの 50,000 枚の顔画像を使用して弱くラベル付けされたしわを作成し、これらからランダムに 1,000 枚の画像をサンプリングしてグランド トゥルースのしわを作成しました。
すべてのデータは Google ドライブでホストされます。
パス | サイズ | ファイル | 形式 | 説明 |
---|---|---|---|---|
ffhq-リンクル-データセット | 6.95GB | メインフォルダ | ||
§ 手動リンクルマスク | 2.8MB | 1,000 | 8 ビット グレースケール PNG (uint8) | 解像度 1024x1024 のしわラベルに手動で注釈を付けます。 |
§ 弱シワマスク | 6.94GB | 50,000 | 8 ビット グレースケール PNG (uint8) | 解像度 1024x1024 の弱いシワラベルが自動的に生成されます。 |
└ 顔解析ラベル | 5.1MB | 1,000 | Numpy 配列 (npy) | 顔を抽出するための顔解析ラベルが含まれています。 |
すべてのスクリプトは、リポジトリ (ffhq-wrincle-dataset) のルート フォルダーから実行する必要があります。
1,000 個の手動リンクル マスクと 50,000 個の弱いリンクル マスクで構成されるリンクル ラベルをダウンロードするには、 download_ffhq_wrinkle.sh
実行してください。このスクリプトは、手動リンクル マスクと弱いリンクル マスクの両方を指定されたbase_folder
にダウンロードします。
bash download_ffhq_wrinkle.sh
download_ffhq_wrinkle.sh
内のbase_folder
変数を変更することで、デフォルトのダウンロード フォルダーを設定できます。
さらに、提供されている Google ドライブのリンクからラベルを直接ダウンロードできます。
指示に従った後のフォルダー構造は次のようになります。
{base_folder}/
├── manual_wrinkle_masks/
│ ├── 00001.png
│ ├── 00011.png
│ ├── ...
│ └── 21035.png
└── weak_wrinkle_masks/
├── 00000/
│ ├── 00000.png
│ ├── 00001.png
│ ├── ...
│ └── 00999.png
├── 01000/
│ ├── 01000.png
│ ├── 01001.png
│ ├── ...
│ └── 01999.png
├── ...
└── 49000/
├── 49000.png
├── 49001.png
├── ...
└── 49999.png
オリジナルの FFHQ 顔画像をダウンロードするには、FFHQ データセットの Web サイトを参照してください。元の FFHQ データセットの ID が 00000 から 49999 の「images1024x1024」サブセットを使用します。画像をダウンロードしたら、指定されたbase_folder
に配置します。
顔画像ダウンロード後のフォルダ構成は以下の通りです。
{base_folder}/
├── images1024x1024/
│ ├── 00000/
│ │ ├── 00000.png
│ │ ├── 00001.png
│ │ ├── ...
│ │ └── 00999.png
│ ├── ...
│ └── 49000/
│ ├── 49000.png
│ ├── 49001.png
│ ├── ...
│ └── 49999.png
├── manual_wrinkle_masks/
│ ├── 00001.png
│ ├── 00011.png
│ ├── ...
│ └── 21035.png
└── weak_wrinkle_masks/
├── 00000/
│ ├── 00000.png
│ ├── 00001.png
│ ├── ...
│ └── 00999.png
├── ...
└── 49000/
├── 49000.png
├── 49001.png
├── ...
└── 49999.png
この論文で概説したトレーニング戦略に従うには、手動のしわマスクに対応する顔画像と、顔以外の領域がマスクされたマスクされた顔画像を準備する必要があります。 face_masking.sh
実行すると、ベースフォルダー内の手動シワラベルに対応する顔画像とマスクされた顔画像を取得できます。
bash face_masking.sh
注: このタスクを実行するには、FFHQ データセットの元の顔画像がbase_folder
に存在する必要があります。
あるいは、Google ドライブのリンクから顔解析されたラベルを直接ダウンロードして、 base_folder
に配置することもできます。次に、 png_parsing.py
とface_masking.py
を順番に実行します。
python png_parsing.py $base_folder /images1024x1024 $base_folder /manual_wrinkle_masks $base_folder /face_images
python face_masking.py $base_folder /face_parsed_labels $base_folder /face_images $base_folder /masked_face_images
手動のしわラベルに対応する顔画像の顔解析済みラベルを、face-parsing.PyTorch を使用して取得した 512x512 numpy 配列として提供します。具体的には、顔と鼻を除くすべての領域をマスクします。
指示後のフォルダー構造は次のとおりです。
{base_folder}/
├── etcs/
│ └── face_parsed_labels/
│ ├── 00000.npy
│ ├── 00011.npy
│ ├── ...
│ └── 21035.npy
├── face_images/
│ ├── 00001.png
│ ├── 00011.png
│ ├── ...
│ └── 21035.png
├── images1024x1024/
│ ├── 00000/
│ │ ├── 00000.png
│ │ ├── 00001.png
│ │ ├── ...
│ │ └── 00999.png
│ ├── ...
│ └── 49000/
│ ├── 49000.png
│ ├── 49001.png
│ ├── ...
│ └── 49999.png
├── manual_wrinkle_masks/
│ ├── 00001.png
│ ├── 00011.png
│ ├── ...
│ └── 21035.png
├── masked_face_images/
│ ├── 00001.png
│ ├── 00011.png
│ ├── ...
│ └── 21035.png
└── weak_wrinkle_masks/
├── 00000/
│ ├── 00000.png
│ ├── 00001.png
│ ├── ...
│ └── 00999.png
├── ...
└── 49000/
├── 49000.png
├── 49001.png
├── ...
└── 49999.png
FFHQ-Wrinkle データセットは、元の FFHQ データセットと同じクリエイティブ コモンズ BY-NC-SA 4.0 ライセンスに基づいて提供されます。次の条件の下で、このデータセットを非営利目的で自由に使用、再配布、改変することができます。
FFHQ-Wrinkle データセットを使用すると、このライセンスの条項に従うことに同意したことになります。その他のお問い合わせや商業利用のリクエストについては、FFHQ データセットのオリジナルの作成者および FFHQ-Wrinkle データセットの作成者にお問い合わせください。
個々の画像は、Creative Commons BY 2.0、Creative Commons BY-NC 2.0、Public Domain Mark 1.0、Public Domain CC0 1.0、または US Government Works ライセンスに基づいて、それぞれの作成者によって Flickr で公開されました。これらのライセンスはすべて、非営利目的での自由な使用、再配布、翻案を許可します。ただし、それらの中には、元の作成者に適切なクレジットを与えること、および画像に加えられた変更を示すことを必要とするものもあります。各画像のライセンスとオリジナルの作者はメタデータに示されています。
FFHQ データセットのライセンスについては、オリジナルの FFHQ データセット Web サイトを参照してください。