مرحبًا بك في مستودع GitHub لورشة عمل ODSC حول LLMOps. تم تصميم ورشة العمل هذه لمساعدتك على إطلاق الإمكانات الكاملة لـ LLMs من خلال التكميم والتقطير والضبط الدقيق وKubernetes وغير ذلك الكثير!
معظم دراسات الحالة هذه مأخوذة من كتابي: Quick Start Guide to LLMs
للمزيد من التفاصيل والانضمام إلى الورشة، اضغط هنا.
تعمق في التطبيق العملي باستخدام دفاتر الملاحظات الشاملة لدينا. سترشدك هذه الدفاتر خطوة بخطوة خلال دراستي الحالة المشمولتين في ورشة العمل، مما يتيح لك تجربة تعليمية تفاعلية وعملية.
وهنا الشرائح لورشة العمل.
تكميم Llama-3 ديناميكيًا - استخدام وحدات البت والبايت لتقدير نموذج في الوقت الفعلي عند التحميل. سوف نتحقق من الاختلافات قبل وبعد التكميم
تعرف على كيفية تحميل نسخة محددة مسبقًا من Llama لمقارنة السرعة واستخدام الذاكرة:
العمل مع GGUF (بدون GPU)
العمل مع GGUF (مع GPU)
تقييم LLMs باستخدام القواعد - استكشاف موجه التقييم لتقييم المخرجات التوليدية
تقييم المحاذاة (إذا سمح الوقت) - معرفة كيف يمكن للماجستير في القانون الحكم على ردود الوكيل
فيما يلي بعض دفاتر الملاحظات التي أرجع إليها أثناء ورشة العمل ولكن لن يكون لدي الوقت الكافي لقراءتها:
إذا استمتعت بدراسات الحالة، فيرجى التفكير في منح كتابي تقييم 5 نجوم على أمازون لأنه يساعدني حقًا كمؤلف! للمزيد من التفاصيل والانضمام إلى الورشة، اضغط هنا.