المتجهات التوجيهية / هندسة التمثيل لنماذج لغة المحولات في Pytorch / Huggingface
تحقق من دفتر الأمثلة الخاص بنا.
المستندات الكاملة: https://steering-vectors.github.io/steering-vectors
توفر هذه المكتبة أدوات مساعدة للتدريب وتطبيق المتجهات التوجيهية على نماذج اللغة (LMs) من Huggingface، مثل GPT وLLaMa وGemma وMistral وPythia وغيرها الكثير!
هذه المكتبة مستوحاة من الأفكار والأكواد من الورقتين التاليتين. لمزيد من المعلومات حول ناقلات التوجيه وهندسة التمثيل، راجع هذه الأعمال:
توجيه اللاما 2 عبر إضافة التنشيط التفاضلي ريمسكي وآخرون، 2023
هندسة التمثيل: نهج من أعلى إلى أسفل لشفافية الذكاء الاصطناعي زو وآخرون، 2023
pip install steering-vectors
تحقق من الوثائق الكاملة لمزيد من معلومات الاستخدام.
نرحب بأي مساهمات لتحسين هذا المشروع! الرجاء فتح مشكلة أو سحب الطلب في هذا الريبو مع أي إصلاحات أخطاء / تغييرات / تحسينات لديك.
يستخدم هذا المشروع Ruff لتنسيق التعليمات البرمجية وفحصها، وMyPy للتحقق من النوع، وPytest للاختبارات. تأكد من أن أي تغييرات ترسلها تجتاز عمليات التحقق من الكود هذه في العلاقات العامة الخاصة بك. إذا كنت تواجه مشكلة في تشغيل هذه العناصر، فلا تتردد في فتح طلب سحب بغض النظر عن ذلك، ويمكننا مناقشة المزيد في قسم العلاقات العامة.
تم إصدار هذا الرمز بموجب ترخيص MIT.