مرحبًا بك في مستودع التقييم والتقييم في LLM ! ؟ هنا ، نتعمق في العالم المثير لنموذج اللغة الكبير (LLM) التقييم والتقييم ، مع التركيز على التقنيات المتطورة لتكييف النماذج مثل Flan-T5 ، Tinyllama ، و Aguila7b لمهام معالجة اللغة الطبيعية المتنوعة (NLP) . ؟
نظرًا لأن LLMs تصبح جزءًا لا يتجزأ من تطبيقات الذكاء الاصطناعي الحديثة ، فإن القدرة على ضبط هذه النماذج وتقييمها بشكل فعال لم تكن أكثر أهمية. تم تصميم هذا المستودع لمساعدتك على التنقل في تعقيدات التخصيص النموذجي ، وتقديم رؤى وأدوات عملية لتعزيز الأداء والدقة والمسؤولية الأخلاقية لنماذجك.
سواء كنت تعمل على:
يوفر هذا المستودع الموارد لرفع مشاريعك إلى المستوى التالي.
أود أن أقدم امتناني القلبية إلى سانتياغو هيرنانديز ، خبير في الأمن السيبراني والذكاء الاصطناعي. كان مساره المذهل حول التعلم العميق و AI Generative ، المتاح في Udemy ، فعالاً في تشكيل تطوير هذا المشروع.
للحصول على معلومات شاملة حول هذا المشروع ، تحقق من هذه المقالة المتوسطة.
للبدء ، تحقق من دفاتر الملاحظات للحصول على أدلة خطوة بخطوة على صقل وتقييم النموذج:
Instruction_Fine_Tuning_LLM_T5.ipynb
: تعليمات مفصلة على صفقات Flan-T5 الدقيقة للتلخيص الإسباني.Evaluation_and_Analysis_T5_Familiy_LLMs.ipynb
؟Parameter_Efficient_Fine_Tuning_QLoRA_Legal_Assistance.ipynb
: تعرف على صقل مع Qlora للمهام المتخصصة مثل صياغة المستندات القانونية. ⚖TinyLLAMA_PPO_RLHF_Avoiding_Offensive_Language.ipynb
: استكشف عملية صقل tinyllama باستخدام PPO و RLHF لتجنب اللغة الضارة أو الهجومية. ؟ ️Evaluation_of_Fine_Tuned_Large_Language_Models_for_ILENIA.ipynb
: تقييم النماذج التي تم ضبطها في إطار Ilenia ، بما في ذلك مشاريع Aguila7b و Latxa. في هذه الدراسة الجديدة ، كان الهدف الأساسي هو ضبط Tinyllama باستخدام تقنيات تحسين السياسة القريبة (PPO) مع التعلم التعزيز من التعليقات البشرية (RLHF) . الهدف من ذلك هو تحسين قدرة النموذج على تجنب توليد لغة ضارة أو مسيئة أو سامة مع الحفاظ على توليد المحتوى ذي معنى.
أبرز ما في الدراسة:
لفهم شامل للمنهجية والنتائج ، راجع دفتر الملاحظات: TinyLLAMA_PPO_RLHF_Avoiding_Offensive_Language.ipynb
.
يعد مشروع Ilenia جزءًا من مشروع إسبانيا الاستراتيجي للانتعاش الاقتصادي والتحول (PLTE) ، والذي يركز على تطوير الموارد المتعددة اللغات لاقتصاد اللغة الجديد (NEL) . تدعم هذه المبادرة استخدام اللغات الإسبانية وغيرها من اللغات الرسمية لدفع النمو الاقتصادي والقدرة التنافسية الدولية في مجالات مثل الذكاء الاصطناعي والترجمة والتعليم.
كجزء من هذا الجهد ، نقوم بتقييم LLMs من مشاريع Aguila7b و Latxa ، والتي تم تصميمها لمهام معالجة النصوص والكلام. تركز هذه التقييمات على أداء النماذج ، مما يضمن أن تتماشى مع الاحتياجات الاجتماعية والتكنولوجية ، وخاصة في السياقات متعددة اللغات وعبر اللغات.
الجوانب الرئيسية:
للحصول على تحليل متعمق ، راجع دفتر الملاحظات: Evaluation_of_Fine_Tuned_Large_Language_Models_for_ILENIA.ipynb
.
في العالم السريع للمعالجة الطبيعية (NLP) ، أصبح الاستفادة من نماذج اللغة التي تم تدريبها قبل التدريب أمرًا بالغ الأهمية لتحسين الأداء عبر مهام مختلفة. ؟ من بين هذه ، تبرز عائلة T5 من النماذج بسبب تعدد استخداماتها وفعاليتها في التعامل مع مجموعة من المهام اللغوية. تتعمق هذه الدراسة في تقييم وتحليل نماذج T5 التي تم تدريبها مسبقًا ، مع التركيز على كيفية استخدام الهندسة الفورية وأمثلة قليلة من الطلقة لضبط هذه النماذج. ؟
أظهرت عائلة T5 ، بما في ذلك نماذج مثل T5-Base و T5-Large و Flan-T5 ، قدرات رائعة في توليد النص ، والإجابة على الأسئلة ، والترجمة. ومع ذلك ، هناك دائمًا مجال للتحسين. إن ضبط هذه النماذج باستخدام هندسة سريعة-مصممة ومطالبات إدخال هيكلة-إلى جانب التعلم قليلًا ، يوفر طريقة قوية لتعزيز أدائها دون إعادة التدريب المكثف.
في هذا العمل ، نقوم بتقييم نماذج T5 المختلفة بدقة ، واستكشاف كيف تؤثر تقنيات الهندسة المختلفة وإعدادات التعلم القليلة على أدائها. هدفنا هو الكشف عن أفضل الممارسات لنماذج صياغة تدريبات مسبقة للتفوق في تطبيقات العالم الحقيقي. من خلال تحليل نقاط القوة والقيود في كل نموذج في ظل ظروف سريعة مختلفة ، تهدف هذه الدراسة إلى توفير رؤى قيمة لتحسين LLMs المستندة إلى T5 لمهام NLP المتنوعة. ؟
للحصول على تجول مفصل لعملية التقييم والنتائج ، يرجى الرجوع إلى دفتر الملاحظات: Evaluation_and_Analysis_T5_Family_LLMs.ipynb
.
مرحبًا بك في هذا المشروع حول تعزيز نموذج اللغة Flan-T5-Small لتلخيص مقالات الصحف الإسبانية! ؟ في هذا الدليل ، نركز على تعليمات صياغة نموذج Flan-T5-Small لتحسين قدرته على توليد ملخصات موجزة ودقيقة لمحتوى الأخبار باللغة الإسبانية.
يوفر Instruction_Fine_Tuning_LLM_T5.ipynb
يغطي:
باتباع الإرشادات الموجودة في دفتر الملاحظات ، ستتعلم كيفية تكييف هذا النموذج القوي الذي تم تدريبه مسبقًا للتعامل مع تلخيص النص الإسباني بشكل فعال ، مما يتيح له تقديم ملخصات واضحة ومتماسكة للمقالات الإخبارية. ؟ ️
للحصول على دليل شامل ، ارجع إلى دفتر Instruction_Fine_Tuning_LLM_T5.ipynb
. استمتع بالاستكشاف والضبط! ؟
يقدم هذا القسم مفهوم الضبط الدقيق الفعال للمعلمة (PEFT) باستخدام Qlora لتعزيز نماذج اللغة في السياقات القانونية. تم تصميم Qlora (التكيف الكمي المنخفضة الرتبة) لضوء نماذج اللغة الكبيرة بكفاءة مع عدد أقل من المعلمات ، مما يقلل من متطلبات الحساب والذاكرة.
The Notebook Parameter_Efficient_Fine_Tuning_QLoRA_Legal_Assistance.ipynb
تفاصيل ما يلي:
يتيح هذا النهج التكيف الفعال لنماذج اللغة مع المهام المتخصصة مثل صياغة المستندات القانونية ، مما يضمن أداءً عاليًا أثناء إدارة استخدام الموارد بشكل فعال.
للحصول على دليل شامل على صقل Qlora ، راجع دفتر Parameter_Efficient_Fine_Tuning_QLoRA_Legal_Assistance.ipynb
. استكشاف إمكانات تقنيات الضبط الفعالة للتطبيقات القانونية! ؟ ⚖
لا تتردد في استكشاف وتجربة والمساهمة في مجال LLMS المثير. ملاحظاتك ومساهماتك دائما موضع ترحيب! ؟
صقل جيد وتقييم!
أود أن أقدم امتناني القلبية إلى سانتياغو هيرنانديز ، خبير في الأمن السيبراني والذكاء الاصطناعي. كان مساره المذهل حول التعلم العميق و AI التوليدي ، المتاح في Udemy ، فعالاً في تشكيل تطور هذا المشروع.
يتم تشجيع المساهمات في هذا المشروع للغاية! إذا كنت مهتمًا بإضافة ميزات جديدة أو حل الأخطاء أو تعزيز وظائف المشروع ، فلا تتردد في تقديم طلبات السحب.
تم تطوير هذا المشروع وصيانته بواسطة سيرجيو سانشيز سانشيز (برنامج الأحلام). شكر خاص لمجتمع المصدر المفتوح والمساهمين الذين جعلوا هذا المشروع ممكنًا. إذا كان لديك أي أسئلة أو ملاحظات أو اقتراحات ، فلا تتردد في الوصول إلى [email protected].
تم ترخيص هذا المشروع بموجب ترخيص معهد ماساتشوستس للتكنولوجيا ، وهو ترخيص برنامج مفتوح المصدر يسمح للمطورين باستخدام البرنامج ونسخه وتعديله وتوزيعه بحرية. ويشمل ذلك الاستخدام في كل من المشاريع الشخصية والتجارية ، مع المتطلبات الوحيدة هي الحفاظ على إشعار حقوق الطبع والنشر الأصلي. ؟
يرجى ملاحظة القيود التالية:
الهدف من هذا الترخيص هو زيادة الحرية للمطورين مع الحفاظ على الاعتراف للمبدعين الأصليين.
MIT License
Copyright (c) 2024 Dream software - Sergio Sánchez
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in all
copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
SOFTWARE.