pytorch openai transformer lm Download - pytorch openai transformer lm Source Code Download

pytorch openai transformer lm

شفرة المصدر الأخرى

1.0.0

تنزيل

تنفيذ Pytorch لنموذج لغة المحول المحول في Openai

هذا هو تطبيق Pytorch لرمز TensorFlow الذي تم توفيره مع ورقة Openai "تحسين فهم اللغة من خلال التدريب قبل التدريب" بقلم أليك رادفورد ، كارثيك ناراسيمهان ، تيم سليمانس وإيليا سوتسكفر.

يشتمل هذا التنفيذ على برنامج نصي للتحميل في نموذج Pytorch الأوزان التي تم تدريبها مسبقًا من قبل المؤلفين مع تنفيذ TensorFlow.

نموذج لغة المحول

توجد فئات النماذج والبرنامج النصي تحميل في model_pytorch.py.

تتبع أسماء الوحدات النمطية في نموذج Pytorch أسماء المتغير في تطبيق TensorFlow. يحاول هذا التنفيذ متابعة الكود الأصلي بأكبر قدر ممكن لتقليل التناقضات.

وبالتالي ، يشتمل هذا التنفيذ أيضًا على خوارزمية تحسين ADAM المعدلة كما هو مستخدم في ورقة Openai مع:

تسوس الأوزان الثابتة بعد عمل Loshchilov et al. و
معدل التعلم المجدولة كما هو شائع الاستخدام للمحولات.

متطلبات

لاستخدام النموذج IT-Self عن طريق استيراد model_pytorch.py ، تحتاج فقط إلى:

Pytorch (الإصدار> = 0.4)

لتشغيل البرنامج النصي التدريبي المصنف في Train.py ستحتاج بالإضافة إلى ذلك:

TQDM
Sklearn
سبيس
ftfy
الباندا

يمكنك تنزيل أوزان الإصدار Openai الذي تم تدريبه مسبقًا من خلال استنساخ ريبو أليك رادفورد ووضع مجلد model الذي يحتوي على الأوزان التي تم تدريبها مسبقًا في الريبو الحالي.

باستخدام النموذج الذي تم تدريبه مسبقًا كنموذج لغة محول

يمكن استخدام النموذج كنموذج لغة محول مع أوزان Openai مسبقًا على النحو التالي:

 from model_pytorch import TransformerModel , load_openai_pretrained_model , DEFAULT_CONFIG

args = DEFAULT_CONFIG
model = TransformerModel ( args )
load_openai_pretrained_model ( model )

يولد هذا النموذج حالات المحول المخفية. يمكنك استخدام فئة LMHead في model_pytorch.py لإضافة وحدة فك ترميز مرتبطة بأوزان التشفير والحصول على نموذج لغة كاملة. يمكنك أيضًا استخدام فئة ClfHead في model_pytorch.py لإضافة مصنف أعلى المحول والحصول على مصنف كما هو موضح في منشور Openai. (انظر مثالًا لكليهما في وظيفة __main__ train.py)

لاستخدام التشفير الموضعي للمحول ، يجب عليك تشفير مجموعة البيانات الخاصة بك باستخدام وظيفة encode_dataset() من utils.py. يرجى الرجوع إلى بداية وظيفة __main__ في Train.py لمعرفة كيفية تحديد المفردات بشكل صحيح وترميز مجموعة البيانات الخاصة بك.

صقل النموذج الذي تم تدريبه مسبقًا على مهمة التصنيف

يمكن أيضًا دمج هذا النموذج في مصنف على النحو المفصل في ورقة Openai. يتم تضمين مثال على صقل المهمة على rocstories cloze مع رمز التدريب في Train.py

يمكن تنزيل مجموعة بيانات Rocstories من موقع الويب المرتبط.

كما هو الحال مع رمز TensorFlow ، ينفذ هذا الرمز نتيجة اختبار cloze rocstories المبلغ عنها في الورقة التي يمكن استنساخها عن طريق التشغيل:

python -m spacy download en
python train.py --dataset rocstories --desc rocstories --submit --analysis --data_dir [path to data here]

التجارب الأولى على مجموعة اختبار rocstories

يستغرق التغلب على نموذج Pytorch لمدة 3 عصر على عمليات التمويل 10 دقائق لتشغيله على Nvidia K-80.

تبلغ دقة اختبار التشغيل الفردي هذا الإصدار Pytorch 85.84 ٪ ، بينما يبلغ المؤلفون دقة متوسطة مع رمز Tensorflow البالغ 85.8 ٪ ، وتبلغ الورقة عن أفضل دقة فردية قدرها 86.5 ٪.

تستخدم تطبيقات المؤلفين 8 GPU ، وبالتالي يمكن أن تستوعب مجموعة من 64 عينة بينما التنفيذ الحالي هو وحدة معالجة الرسومات الفردية ونتائج تقتصر على 20 حالة على K80 لأسباب الذاكرة. في اختبارنا ، زادت حجم الدفعة من 8 إلى 20 عينة من دقة الاختبار بمقدار 2.5 نقطة. يمكن الحصول على دقة أفضل باستخدام إعداد متعدد GPU (لم يتجرب بعد).

تبلغ SOTA السابقة على مجموعة بيانات Rocstories 77.6 ٪ ("نموذج التماسك المخفي" لـ Chaturvedi et al. تم نشره في "فهم القصة" للتنبؤ بما يحدث بعد ذلك "EMNLP 2017 ، وهي ورقة لطيفة للغاية أيضًا!)

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-02
الحجم 213.06KB
من Github

تطبيقات ذات صلة

openai realtime console

2024-11-05
pytorch image models

2024-11-03
openai

2024-05-24
OpenAI النسخة المحلية

2024-05-22
النسخة المحمولة من مونستر ترانسفورمر

2023-09-07
إنتاج صفحة الويب الخاصة بالاعترافات عبر الإنترنت من LM PHP، النسخة الجميلة، النسخة الرسمية، كود مصدر PHP

2022-11-01

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
chat.petals.dev

شفرة المصدر الأخرى

1.0.0
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل