นี่คือรหัสอย่างเป็นทางการสำหรับ "SafeGen: ลดการสร้างเนื้อหาทางเพศที่โจ่งแจ้งในรูปแบบข้อความเป็นรูปภาพ"
SafeGen จะปรากฏในการประชุม ACM เรื่อง Computer and Communications Security ( ACM CCS 2024 ) Core-A*, CCF-A, Big 4 เราได้จัดทำเวอร์ชันพร้อมกล้องบน ArXiv
เราได้เปิดตัวโมเดลฝึกหัดบน Hugging Face แล้ว โปรดตรวจสอบวิธีการใช้สำหรับการอนุมาน ?.
การเผยแพร่ของเราเกี่ยวข้องกับการปรับเลเยอร์การเอาใจใส่ตนเองของ Stable Diffusion เพียงอย่างเดียวโดยอิงตามแฝดสามภาพเท่านั้น
การใช้งานนี้ถือได้ว่าเป็นตัวอย่างที่สามารถรวมเข้ากับไลบรารี Diffusers ได้ ดังนั้น คุณสามารถไปที่โฟลเดอร์ examples/text_to_image/ และทำความเข้าใจวิธีการทำงาน
หากคุณพบว่าเอกสาร/โค้ด/เกณฑ์มาตรฐานของเรามีประโยชน์ โปรดพิจารณาอ้างอิงงานนี้โดยมีข้อมูลอ้างอิงต่อไปนี้:
@inproceedings{li2024safegen,
author = {Li, Xinfeng and Yang, Yuchen and Deng, Jiangyi and Yan, Chen and Chen, Yanjiao and Ji, Xiaoyu and Xu, Wenyuan},
title = {{SafeGen: Mitigating Sexually Explicit Content Generation in Text-to-Image Models}},
booktitle = {Proceedings of the 2024 {ACM} {SIGSAC} Conference on Computer and Communications Security (CCS)},
year = {2024},
}
หรือ
@article{li2024safegen,
title={{SafeGen: Mitigating Unsafe Content Generation in Text-to-Image Models}},
author={Li, Xinfeng and Yang, Yuchen and Deng, Jiangyi and Yan, Chen and Chen, Yanjiao and Ji, Xiaoyu and Xu, Wenyuan},
journal={arXiv preprint arXiv:2404.06666},
year={2024}
}
คุณสามารถเรียกใช้โค้ดนี้โดยใช้ A100-40GB (NVIDIA) ตัวเดียวด้วยการกำหนดค่าเริ่มต้นของเรา โดยเฉพาะอย่างยิ่ง ให้ตั้งค่า training_batch_size
ขนาดเล็กเพื่อหลีกเลี่ยงข้อผิดพลาดหน่วยความจำไม่เพียงพอ
เราขอแนะนำให้คุณจัดการสภาพแวดล้อม conda สองรายการเพื่อหลีกเลี่ยงความขัดแย้งในการอ้างอิง
สภาพแวดล้อม Pytorch สำหรับการปรับเลเยอร์การเอาใจใส่ตนเองของโมเดล Stable Diffusion และไลบรารีที่เกี่ยวข้องกับการประเมินผล
สภาพแวดล้อม Tensorflow ที่จำเป็นสำหรับโมเดลต่อต้านดีพนูดสำหรับขั้นตอนการเตรียมข้อมูล
# You can install the main dependencies by conda/pip
conda create -n text-agnostic-t2i python=3.8.5
conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
# Using the official Diffusers package
pip install --upgrade diffuers[torch]
# Or you may use the community maintained version
conda install -c conda-forge diffusers
...
# Or you can create the env via environment.yaml
conda env create -f environment_pytorch.yaml
เนื่องจากโมเดลต่อต้าน Deepnude ต้องใช้ TensorFlow 1.13 คุณจึงสามารถติดตั้ง Python<=3.7 ได้
# You can install the dependencies individually
conda create -n anti-deepndue python=3.7
pip install tensorflow-gpu==1.13.1 keras==2.2.4
...
# Or you can create the env via environment.yaml
conda env create -f environment_tf.yaml
คุณสามารถรับคู่ <nude, mosaic> ได้จาก:
python anti-deepnude.py
export MODEL_NAME= " CompVis/stable-diffusion-v1-4 " # export the model you want to protect
export TRAIN_DIR= " <path to the manifest of your training files>/meta.csv " # export your image triplets folder
accumulation_steps=5
learning_rate=1e-05
steps=1000
train_batch_size=1
warmup_steps=200
weight_tune=0.1
weight_preserve=0.9
defend_type= " nudity_advtrain "
current_time= $( date + ' %m%d_%H%M ' )
output_dir= " mos_model_sal_ " ${defend_type} - " step_ " ${steps} - " lr_ " ${learning_rate} - " warm_ " ${warmup_steps} - ${weight_tune} + ${weight_preserve} " gacc_ " ${accumulation_steps} - ${current_time}
export CUDA_VISIBLE_DEVICES=0
accelerate launch --mixed_precision= " fp16 " " --num_processes=1 " train_text_to_image_adjust_sal.py
--pretrained_model_name_or_path= $MODEL_NAME
--train_data_dir= $TRAIN_DIR
--use_ema
--resolution=512 --center_crop
--train_batch_size ${train_batch_size}
--gradient_accumulation_steps ${accumulation_steps}
--gradient_checkpointing
--max_train_steps ${steps}
--learning_rate ${learning_rate}
--image_column= " nude_image_path "
--max_grad_norm=1
--lr_scheduler= " constant "
--lr_warmup_steps ${warmup_steps}
--output_dir ${output_dir}
--weight_tune ${weight_tune}
--weight_preserve ${weight_preserve}
--checkpoints_total_limit 0
--validation_prompts " woman, nudity " " a running dog on grass " " a woman standing aside the colorful table " " a nude sexy man, blue eyes "
# In addition, you can set the 'validation_prompts' to visually monitor the training efficacy, such as "a running dog on grass", "a woman standing aside the colorful table", "a nude sexy man, blue eyes", etc.
เพียงแค่เรียกใช้สคริปต์
run_adjust_SD.sh
from diffusers import StableDiffusionPipeline
import torch
model_path = ${output_dir} # the save path of your model
pipeline = StableDiffusionPipeline.from_pretrained(model_path, torch_dtype=torch.float16)
pipeline.to( " cuda " )
prompt = " a photo of an astronaut riding a horse on mars "
image = pipeline(prompt).images[0]
image.save( " example.png " )
ข้อความแจ้งเตือนที่เป็นปฏิปักษ์มากกว่า 50,000 รายการ รวมถึงข้อความแจ้งที่ปรับให้เหมาะสมด้วยตนเองซึ่งปรากฏว่าไม่มีอันตราย ได้รับการพัฒนาเพื่อทดสอบการแสวงหาประโยชน์ที่อาจเกิดขึ้นจากโมเดล T2I ในการสร้างเนื้อหาทางเพศที่โจ่งแจ้ง เนื่องจากลักษณะที่ละเอียดอ่อนของรูปภาพเหล่านี้ การเข้าถึงจึงถูกจำกัดเพื่อให้แน่ใจว่ามีการปฏิบัติตามหลักจริยธรรม นักวิจัยที่สนใจใช้ภาพเหล่านี้เพื่อวัตถุประสงค์ทางวิชาการจะต้องสัญญาว่าจะไม่เผยแพร่ภาพเหล่านี้เพิ่มเติม โปรดติดต่อฉันเพื่อขอเข้าถึงและหารือเกี่ยวกับการป้องกันที่จำเป็น ที่อยู่อีเมลของฉันคือ: [email protected]
งานนี้อิงจากงานวิจัยที่น่าทึ่งและโครงการโอเพ่นซอร์ส ขอบคุณมากสำหรับผู้เขียนทุกคนที่แบ่งปัน!
@misc{von-platen-etal-2022-diffusers,
author = {Patrick von Platen and Suraj Patil and Anton Lozhkov and Pedro Cuenca and Nathan Lambert and Kashif Rasul and Mishig Davaadorj and Thomas Wolf},
title = {Diffusers: State-of-the-art diffusion models},
year = {2022},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = { url {https://github.com/huggingface/diffusers}}
}
ต่อต้าน Deepnude
ทำความสะอาด-Fid
@inproceedings{parmar2021cleanfid,
title={On Aliased Resizing and Surprising Subtleties in GAN Evaluation},
author={Parmar, Gaurav and Zhang, Richard and Zhu, Jun-Yan},
booktitle={CVPR},
year={2022}
}
@inproceedings{zhang2018perceptual,
title={The Unreasonable Effectiveness of Deep Features as a Perceptual Metric},
author={Zhang, Richard and Isola, Phillip and Efros, Alexei A and Shechtman, Eli and Wang, Oliver},
booktitle={CVPR},
year={2018}
}