حاول هنا
انضم إلى خلافنا
يعمل Simplifine على تبسيط ضبط LLM على أي مجموعة بيانات أو نموذج باستخدام أمر واحد بسيط، والتعامل مع جميع البنية التحتية وإدارة الوظائف والتخزين السحابي والاستدلال.
ضبط LLM سهل قائم على السحابة: قم بضبط أي LLM بأمر واحد فقط.
التكامل السحابي السلس: إدارة تنزيل النماذج وتخزينها وتشغيلها تلقائيًا من السحابة مباشرةً.
مساعدة الذكاء الاصطناعي المضمنة: احصل على مساعدة بشأن اختيار المعلمات الفائقة وإنشاء مجموعات البيانات الاصطناعية وفحوصات جودة البيانات.
التبديل على الجهاز إلى السحابة: أضف أداة تزيين بسيطة للانتقال من التدريب المحلي إلى التدريب المستند إلى السحابة.
التحسين التلقائي: يعمل تلقائيًا على تحسين موازاة النموذج والبيانات من خلال Deepspeed ✅ وFDSP ✅.
دعم التقييم المخصص: استخدم LLM المدمج لوظائف التقييمات أو قم باستيراد مقاييس التقييم المخصصة الخاصة بك.
دعم المجتمع: طرح أي أسئلة دعم على Simplifine Community Discord.
موثوق به من قبل المؤسسات الرائدة: تعتمد مختبرات الأبحاث في جامعة أكسفورد على Simplifine لتلبية احتياجاتها في مجال ضبط ماجستير إدارة الأعمال.
ابدأ هنا >
ابحث عن وثائقنا الكاملة على docs.simplefine.com.
التثبيت من PyPI
تثبيت النقطة simplifine-alpha
يمكنك أيضًا التثبيت مباشرةً من github باستخدام الأمر التالي:
تثبيت النقطة git+https://github.com/simplifine-llm/Simplifine.git
نحن نبحث عن المساهمين! انضم إلى موضوع contributors
على Discord:
تم ترخيص Simplifine بموجب ترخيص GNU General Public License الإصدار 3. راجع ملف الترخيص لمزيد من التفاصيل.
لجميع طلبات الميزات والأخطاء والدعم، انضم إلى Discord!
إذا كان لديك أي اقتراحات بشأن الميزات الجديدة التي ترغب في تنفيذها، فيرجى إثارة مشكلة - وسنعمل جاهدين لتحقيق ذلك في أسرع وقت ممكن!
إذا كانت لديك أي أسئلة أخرى، فلا تتردد في الاتصال بنا على [email protected].
؟ إصلاحات الأخطاء: تعليمات برمجية مبسطة وحل المشكلات المتعلقة بالمدرب من أجل تشغيل أكثر سلاسة.
ميزة جديدة: تقديم الدعم لتحديد ملفات التكوين الأكثر تعقيدًا، مما يعزز مرونة المدرب.
التوثيق: تمت إضافة أمثلة جديدة، بما في ذلك البرامج التعليمية حول التدريب السحابي وإنشاء جهاز كشف الأخبار المزيفة.
؟ الوثائق المحدثة: اطلع على أحدث المستندات على docs.simplefine.com.
؟ إصلاحات الأخطاء: تم إصلاح المشكلات التي تسببت في فشل التحميل في تكوينات معينة، مما يضمن التوافق على نطاق أوسع.
ميزة جديدة: تمكين التثبيت المباشر من Git وإضافة دعم لـ Hugging Face API Tokens، مما يسمح بالوصول إلى النماذج المقيدة.
التوثيق: أمثلة محدثة لتعكس أحدث الميزات.
نحن ندعم حاليًا كلاً من DistributedDataParallel (DDP) وZeRO من DeepSpeed.
ليرة تركية :
يكون DDP مفيدًا عندما يمكن احتواء النموذج في ذاكرة GPU (وهذا يشمل التدرجات وحالات التنشيط).
يكون ZeRO مفيدًا عندما يتطلب النموذج التقسيم عبر وحدات معالجة الرسومات المتعددة.
نسخة أطول :
DDP : تقوم البيانات الموزعة المتوازية (DDP) بإنشاء نسخة طبق الأصل من النموذج على كل معالج (GPU). على سبيل المثال، تخيل 8 وحدات معالجة رسوميات، يتم تغذية كل منها بنقطة بيانات واحدة - وهذا من شأنه أن يجعل حجم الدفعة 8. يتم بعد ذلك تحديث النسخ المتماثلة للنموذج على كل جهاز. يعمل DDP على تسريع التدريب من خلال موازنة عملية تغذية البيانات. ومع ذلك، يفشل DDP إذا لم يمكن احتواء النسخة المتماثلة في ذاكرة GPU. تذكر أن الذاكرة لا تستضيف المعلمات فحسب، بل تستضيف أيضًا التدرجات وحالات المُحسّن.
ZeRO : ZeRO هو تحسين قوي تم تطويره بواسطة DeepSpeed ويأتي في مراحل مختلفة (1 و2 و3). تقوم كل مرحلة بتقسيم أجزاء مختلفة من عملية التدريب (المعلمات والتدرجات وحالات التنشيط). يعد هذا مفيدًا حقًا إذا كان النموذج لا يمكن احتواؤه في ذاكرة وحدة معالجة الرسومات. يدعم ZeRO أيضًا التفريغ إلى وحدة المعالجة المركزية، مما يوفر مساحة أكبر لتدريب النماذج الأكبر حجمًا.
طراز LLaMA-3-8b بدقة 16 بت : استخدم Zero Stage 3 على 8 طائرات A100.
طراز LLaMA-3-8b مع محولات LoRA : عادةً ما يكون جيدًا مع DDP على A100s.
GPT-2 بدقة 16 بت : استخدم DDP.
المشكلة: RuntimeError: حدث خطأ أثناء إنشاء ملحق "cpu_adam" python dev
يحدث هذا الخطأ عندما لا يتم تثبيت python-dev
، ويستخدم ZeRO عملية إلغاء التحميل. لحل هذه المشكلة، حاول:
# جرب sudo apt-get install python3-dev إذا فشل التالي.apt-get install python-dev # for Python 2.x installsapt-get install python3-dev # لعمليات تثبيت Python 3.x
انظر هذا الرابط