تنزيل StoryMaker - تنزيل رمز المصدر StoryMaker

StoryMaker

شفرة المصدر الأخرى

1.0.0

تنزيل

صانع القصة: نحو شخصيات ثابتة في توليد نص إلى صورة

صانع القصة هو حل التخصيص لا يحافظ فقط على اتساق الوجوه ولكن أيضًا على الملابس وتسريحات الشعر والأجسام في مشهد الشخصيات المتعددة ، مما يتيح القدرة على صنع قصة تتكون من سلسلة من الصور.

تصور الصور التي تم إنشاؤها بواسطة صانع القصص. تروي الصفوف الثلاثة الأولى قصة عن يوم في حياة "عامل المكتب" ، ويحكي الصفان الأخيران قصة عن فيلم "قبل شروق الشمس".

أخبار

[2024/11/09] نقوم بإصدار رمز التدريب.
[2024/09/20] ننشر التقرير الفني.
[2024/09/02] نطلق الأوزان النموذجية.

العروض التوضيحية

صورتان توليف

تطبيق متنوع

تحميل

يمكنك تنزيل النموذج مباشرة من Huggingface.

إذا لم تتمكن من الوصول إلى Huggingface ، فيمكنك استخدام HF-Mirror لتنزيل النماذج.

 تصدير hf_endpoint = https: //hf-mirror.comhuggingface-cli download-download-download red-aigc/storymaker-local-dir chockts-local-dir-use-symlinks false

بالنسبة إلى Encoder للوجه ، تحتاج إلى التنزيل يدويًا عبر عنوان URL هذا إلى models/buffalo_l لأن الرابط الافتراضي غير صالح. بمجرد إعداد جميع النماذج ، يجب أن تكون شجرة المجلد مثل:

  .
  ├── models
  ├── checkpoints/mask.bin
  ├── pipeline_sdxl_storymaker.py
  └── README.md

الاستخدام

 #! PIP تثبيت Opencv-Python Transformers reclerate InsightImport DiffuserSimport cv2import torcheimport as npfrom pil importfrom insightface eanalysis (name = 'buffalo_l' ، root = './' ، مقدمي الخدمات = ['cudaexecutionprovider' ، 'cpuexecutionprovider']) app.prepare (ctx_id = 0 ، det_size = (640 ، 640)) "image_encoder_path = 'laion/clip-vit-h-14-laion2b-s32b-b79k' # from https://huggingface.co/laion/clip-vit-h-14-laion2b-s32b-b79kbase_model = 'huaqan/yamermix_v11 ' # من https://huggingface.co/huaquan/yamermix_v11pipe = stablediffusionxlstorymakerpipeline.from_pretrained (base_model ، torch_dtype = torch.float16) pipe.cuda () # load A_SCALE = 0.8) pipe.scheduler = unipcmultistepscheduler.from_config (pipe.scheduler.config)

ثم ، يمكنك تخصيص صورك الخاصة

 # قم بتحميل صورة و maskface_image = image.open ("أمثلة/ldh.png").
    face_info = app.get (cv2.cvtcolor (np.array (face_image) ، cv2.color_rgb2bgr)) face_info = sorted (face_info ، key = lambda x: (x ['bbox'] [2] -x ['bbox'] [0])*(x ['bbox'] [3] -x ['bbox'] [1])) [-1] # فقط استخدم maximum faceprompt = "شخص يأخذ صورة شخصية ، الشخص يرتدي توجد قبعة حمراء ، وبركان على مسافة "n_prompt =" جودة سيئة ، NSFW ، جودة منخفضة ، قبيحة ، مشوهة ، مشوهة "= torch.generator (device = 'cuda'). manual_seed (666) for i in range (4): الإخراج = الأنابيب (صورة = face_image ، mask_image = mask_image ، face_info = face_info ، proper = proper ، segent_prompt = n_prompt ، ip_adapter_scale = 0.8 ، lora_scale = 0.8 ، num_inference_steps = 25 ، guidance_scale = 7.5 ، 960 ، مولد = مولد ،
    .

شكر وتقدير

عملنا مستوحى للغاية من IP-Adapter و InstantId. شكرا لأعمالهم العظيمة!
شكرًا Yamer على تطوير Yamermix ، نستخدمه كنموذج أساسي في العرض التجريبي الخاص بنا.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-02-17
الحجم 19.8MB
من Github

تطبيقات ذات صلة

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
chat.petals.dev

2024-11-30
viptools for eslam

2024-12-15

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
SmartTube

شفرة المصدر الأخرى

24.71 Stable
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
wp functions

فئات أخرى

1.0.0
termwind

فئات أخرى

v2.3.0

أخبار ذات صلة الكل