FFHQ-Wrinkle은 FFHQ(Flickr-Faces-HQ) 데이터 세트의 확장으로, 얼굴 주름과 관련된 추가 기능을 포함하도록 특별히 설계되었습니다. 이 데이터 세트는 얼굴 인식, 노화 시뮬레이션 및 기타 관련 분야의 연구 개발을 지원하는 것을 목표로 합니다.
연구에 이 데이터세트를 사용하는 경우 다음 논문을 인용해 주세요.
업데이트 예정
최초의 공개 얼굴 주름 데이터세트인 'FFHQ-Wrinkle'은 얼굴 이미지 쌍과 해당 주름 마스크로 구성됩니다. 다양한 각도와 조명 조건에서 촬영된 70,000개의 고해상도(1024x1024) 얼굴 이미지가 포함된 기존 고해상도 얼굴 이미지 데이터세트 FFHQ(Flickr-Faces-HQ)를 활용하면서 주름 라벨에 중점을 두었습니다. 우리가 제공하는 데이터 세트는 수동으로 레이블이 지정된 주름 마스크 세트(N=1,000)와 사람의 노동 없이 생성된 "약한" 주름 마스크 또는 마스크된 텍스처 맵 세트(N=50,000)로 구성됩니다. 우리는 FFHQ 데이터 세트에서 50,000개의 이미지, 특히 이미지 ID 00000에서 49999를 선택했습니다. 이 50,000개의 얼굴 이미지를 사용하여 약하게 라벨이 붙은 주름을 만들고 이 중에서 무작위로 1,000개의 이미지를 샘플링하여 실제 주름을 만들었습니다.
모든 데이터는 Google 드라이브에서 호스팅됩니다.
길 | 크기 | 파일 | 체재 | 설명 |
---|---|---|---|---|
ffhq-주름-데이터세트 | 6.95GB | 메인 폴더 | ||
├ 수동 주름 마스크 | 2.8MB | 1,000 | 8비트 회색조 PNG(uint8) | 1024x1024 해상도의 수동 주석 주름 라벨입니다. |
├ 약주름 마스크 | 6.94GB | 50,000 | 8비트 회색조 PNG(uint8) | 1024x1024 해상도로 약한 주름 라벨을 자동으로 생성합니다. |
└ 얼굴 분석 라벨 | 5.1MB | 1,000 | Numpy 배열(npy) | 얼굴 추출을 위해 얼굴 구문 분석된 라벨이 포함됩니다. |
모든 스크립트는 리포지토리의 루트 폴더(ffhq-wrinkle-dataset)에서 실행되어야 합니다.
수동 주름 마스크 1,000개와 약한 주름 마스크 50,000개로 구성된 주름 라벨을 다운로드하려면 download_ffhq_wrinkle.sh
실행하세요. 이 스크립트는 수동 주름 마스크와 약한 주름 마스크를 모두 지정된 base_folder
에 다운로드합니다.
bash download_ffhq_wrinkle.sh
download_ffhq_wrinkle.sh
내의 base_folder
변수를 수정하여 기본 다운로드 폴더를 설정할 수 있습니다.
또한 제공된 Google 드라이브 링크를 통해 라벨을 직접 다운로드할 수 있습니다.
지침을 따른 후의 폴더 구조는 다음과 같습니다.
{base_folder}/
├── manual_wrinkle_masks/
│ ├── 00001.png
│ ├── 00011.png
│ ├── ...
│ └── 21035.png
└── weak_wrinkle_masks/
├── 00000/
│ ├── 00000.png
│ ├── 00001.png
│ ├── ...
│ └── 00999.png
├── 01000/
│ ├── 01000.png
│ ├── 01001.png
│ ├── ...
│ └── 01999.png
├── ...
└── 49000/
├── 49000.png
├── 49001.png
├── ...
└── 49999.png
원본 FFHQ 얼굴 이미지를 다운로드하려면 FFHQ 데이터세트 웹사이트를 참조하세요. 원본 FFHQ 데이터 세트의 ID가 00000에서 49999까지인 'images1024x1024' 하위 집합을 사용합니다. 이미지를 다운로드한 후 지정된 base_folder
에 배치하세요.
얼굴 이미지를 다운로드한 후의 폴더 구조는 다음과 같습니다.
{base_folder}/
├── images1024x1024/
│ ├── 00000/
│ │ ├── 00000.png
│ │ ├── 00001.png
│ │ ├── ...
│ │ └── 00999.png
│ ├── ...
│ └── 49000/
│ ├── 49000.png
│ ├── 49001.png
│ ├── ...
│ └── 49999.png
├── manual_wrinkle_masks/
│ ├── 00001.png
│ ├── 00011.png
│ ├── ...
│ └── 21035.png
└── weak_wrinkle_masks/
├── 00000/
│ ├── 00000.png
│ ├── 00001.png
│ ├── ...
│ └── 00999.png
├── ...
└── 49000/
├── 49000.png
├── 49001.png
├── ...
└── 49999.png
우리 논문에 설명된 훈련 전략을 따르려면 수동 주름 마스크에 해당하는 얼굴 이미지와 얼굴 이외의 영역이 마스크된 마스크된 얼굴 이미지를 준비해야 합니다. face_masking.sh
실행하면 기본 폴더에 있는 수동 주름 라벨에 해당하는 얼굴 이미지와 마스크된 얼굴 이미지를 얻을 수 있습니다.
bash face_masking.sh
참고 : 이 작업을 수행하려면 FFHQ 데이터 세트의 원본 얼굴 이미지가 base_folder
에 있어야 합니다.
또는 Google 드라이브 링크에서 얼굴 분석 라벨을 직접 다운로드하여 base_folder
에 배치할 수 있습니다. 그런 다음 png_parsing.py
와 face_masking.py
순차적으로 실행합니다.
python png_parsing.py $base_folder /images1024x1024 $base_folder /manual_wrinkle_masks $base_folder /face_images
python face_masking.py $base_folder /face_parsed_labels $base_folder /face_images $base_folder /masked_face_images
수동 주름 라벨에 해당하는 얼굴 이미지에 대해 얼굴 분석 라벨을 512x512 numpy 배열로 제공하며, 이는 facial-parsing.PyTorch를 사용하여 얻은 것입니다. 구체적으로는 얼굴과 코를 제외한 모든 부위를 마스크합니다.
지침 이후의 폴더 구조는 다음과 같습니다.
{base_folder}/
├── etcs/
│ └── face_parsed_labels/
│ ├── 00000.npy
│ ├── 00011.npy
│ ├── ...
│ └── 21035.npy
├── face_images/
│ ├── 00001.png
│ ├── 00011.png
│ ├── ...
│ └── 21035.png
├── images1024x1024/
│ ├── 00000/
│ │ ├── 00000.png
│ │ ├── 00001.png
│ │ ├── ...
│ │ └── 00999.png
│ ├── ...
│ └── 49000/
│ ├── 49000.png
│ ├── 49001.png
│ ├── ...
│ └── 49999.png
├── manual_wrinkle_masks/
│ ├── 00001.png
│ ├── 00011.png
│ ├── ...
│ └── 21035.png
├── masked_face_images/
│ ├── 00001.png
│ ├── 00011.png
│ ├── ...
│ └── 21035.png
└── weak_wrinkle_masks/
├── 00000/
│ ├── 00000.png
│ ├── 00001.png
│ ├── ...
│ └── 00999.png
├── ...
└── 49000/
├── 49000.png
├── 49001.png
├── ...
└── 49999.png
FFHQ-Wrinkle 데이터세트는 원본 FFHQ 데이터세트와 동일한 Creative Commons BY-NC-SA 4.0 라이선스에 따라 제공됩니다. 다음 조건에 따라 비상업적 목적으로 이 데이터 세트를 자유롭게 사용, 재배포 및 조정할 수 있습니다.
FFHQ-Wrinkle 데이터세트를 사용함으로써 귀하는 본 라이선스의 조건을 준수하는 데 동의하게 됩니다. 상업적 사용에 대한 추가 문의나 요청이 있는 경우 FFHQ 데이터 세트의 원본 작성자와 FFHQ-Wrinkle 데이터 세트의 작성자에게 문의하세요.
개별 이미지는 Creative Commons BY 2.0, Creative Commons BY-NC 2.0, Public Domain Mark 1.0, Public Domain CC0 1.0 또는 US Government Works 라이센스에 따라 각 작성자가 Flickr에 게시했습니다. 이러한 라이센스는 모두 비상업적 목적으로 무료 사용, 재배포 및 개작을 허용합니다. 그러나 그 중 일부는 원본 작성자를 적절하게 표시하고 이미지에 적용된 변경 사항을 표시하도록 요구합니다. 각 이미지의 라이선스와 원저작자는 메타데이터에 표시됩니다.
FFHQ 데이터세트 라이선스는 원본 FFHQ 데이터세트 웹사이트를 참조하세요.