Поскольку в статье ByteDance под названием «MagicMix: Semantic Mixing with Diffusion Models» (https://arxiv.org/abs/2210.16056) не был опубликован их код, я реализовал здесь блокнот Jupyter, так что вы можете его попробовать.
В блокноте реализована функция magic_mix
, которая определяет путь к изображению и подсказку, к которой следует адаптировать изображение.
Дополнительные необязательные параметры:
nu: контролирует, насколько приглашение должно перезаписывать исходное изображение на начальном этапе макета. Если ваш результат слишком близок к исходному изображению, попробуйте увеличить этот параметр.
total_steps: количество шагов вывода для стабильной диффузии
guide_scale: это бесплатное руководство классификатора. Чем выше этот параметр, тем больше ваш результат будет соответствовать вашему запросу.
Примеры: