تنزيل LM SupCon - تنزيل كود مصدر LM SupCon

LM SupCon

كود الذكاء الاصطناعي

1.0.0

تنزيل

التعلم المقارن لمتعلمي اللغة المعتمدين على السرعة

يغطي هذا الريبو تنفيذ الورقة التالية: التعلم المقارن لمتعلمي اللغات قليلي الخبرة القائمين على أساس سريع بقلم يرين جيان، وتشونغيانغ جاو، وسوروش فوسوغي، وتم قبولهم في NAACL 2022.

إذا وجدت هذا الريبو مفيدًا لبحثك، فيرجى التفكير في الاستشهاد بالورقة البحثية.

 @inproceedings { jian-etal-2022-contrastive ,
    title = " Contrastive Learning for Prompt-based Few-shot Language Learners " ,
    author = " Jian, Yiren  and
      Gao, Chongyang  and
      Vosoughi, Soroush " ,
    booktitle = " Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies " ,
    month = jul,
    year = " 2022 " ,
    address = " Seattle, United States " ,
    publisher = " Association for Computational Linguistics " ,
    url = " https://aclanthology.org/2022.naacl-main.408 " ,
    pages = " 5577--5587 " ,
    abstract = "The impressive performance of GPT-3 using natural language prompts and in-context learning has inspired work on better fine-tuning of moderately-sized models under this paradigm. Following this line of work, we present a contrastive learning framework that clusters inputs from the same class for better generality of models trained with only limited examples. Specifically, we propose a supervised contrastive framework that clusters inputs from the same class under different augmented {``}views{''} and repel the ones from different classes. We create different {``}views{''} of an example by appending it with different language prompts and contextual demonstrations. Combining a contrastive loss with the standard masked language modeling (MLM) loss in prompt-based few-shot learners, the experimental results show that our method can improve over the state-of-the-art methods in a diverse set of 15 language tasks. Our framework makes minimal assumptions on the task or the base model, and can be applied to many recent methods with little modification.",
}

تم استعارة الكود الخاص بنا بشكل كبير من LM-BFF وSupCon ( /src/losses.py ).

متطلبات

تم اختبار هذا الريبو باستخدام Ubuntu 18.04.5 LTS وPython 3.7 وPyTorch 1.6.0 وCUDA 10.1. ستحتاج إلى وحدة معالجة رسومات 48 جيجابايت للتجارب مع RoBERTa-base، ووحدات معالجة رسومات 4x 48 جيجابايت لـ RoBERTa-large. نحن نجري تجاربنا على Nvidia RTX-A6000 وRTX-8000، ولكن Nvidia A100 بسعة 40 جيجابايت يجب أن يعمل أيضًا.

تنزيل البيانات

نحن نستخدم مجموعات البيانات المعالجة مسبقًا (SST-2، SST-5، MR، CR، MPQA، Subj، TREC، CoLA، MNLI، SNLI، QNLI، RTE، MRPC، QQP) من LM-BFF. يقدم LM-BFF نصوصًا مفيدة لتنزيل مجموعة البيانات وإعدادها. ما عليك سوى تشغيل الأوامر أدناه.

 cd data
bash download_dataset.sh

ثم استخدم الأمر التالي لإنشاء مجموعات بيانات مكونة من 16 طلقة استخدمناها في الدراسة.

python tools/generate_k_shot_data.py

تشغيل الضبط الدقيق لدينا

تم تحديد المطالبات الأساسية (القوالب) المستخدمة للمهام مسبقًا في run_experiments.sh . يمكن العثور على القوالب المساعدة المستخدمة عند إنشاء طرق عرض متعددة لمدخلات التعلم المتباين في /auto_template/$TASK .

بافتراض أن لديك وحدة معالجة رسومات واحدة في نظامك، فإننا نعرض مثالاً على تشغيل الضبط الدقيق على SST-5 (قوالب عشوائية وعروض توضيحية عشوائية لـ "العرض المعزز" للمدخلات).

 for seed in 13 21 42 87 100   # ### random seeds for different train-test splits
do
    for bs in 40   # ### batch size
    do
        for lr in 1e-5    # ### learning rate for MLM loss
        do
            for supcon_lr in 1e-5    # ### learning rate for SupCon loss
            do
                TAG=exp 
                TYPE=prompt-demo 
                TASK=sst-5 
                BS= $bs 
                LR= $lr 
                SupCon_LR= $supcon_lr 
                SEED= $seed 
                MODEL=roberta-base 
                bash run_experiment.sh
            done
        done
    done
done

rm -rf result/

ينطبق إطار عملنا أيضًا على الطريقة المستندة إلى الموجه دون العروض التوضيحية، على سبيل المثال، TYPE=prompt (في هذه الحالة، نقوم فقط بأخذ عينات عشوائية من القوالب لإنشاء "طرق عرض معززة"). يتم حفظ النتائج في log .

يتطلب استخدام RoBERTa-large كنموذج أساسي 4 وحدات معالجة رسوميات، تحتوي كل منها على ذاكرة بسعة 48 جيجابايت. تحتاج أولاً إلى تعديل السطر 20 في src/models.py ليكون def __init__(self, hidden_size=1024) .

 for seed in 13 21 42 87 100   # ### random seeds for different train-test splits
do
    for bs in 10   # ### batch size for each GPU, total batch size is then 40
    do
        for lr in 1e-5    # ### learning rate for MLM loss
        do
            for supcon_lr in 1e-5    # ### learning rate for SupCon loss
            do
                TAG=exp 
                TYPE=prompt-demo 
                TASK=sst-5 
                BS= $bs 
                LR= $lr 
                SupCon_LR= $supcon_lr 
                SEED= $seed 
                MODEL=roberta-large 
                bash run_experiment.sh
            done
        done
    done
done

rm -rf result/

جمع النتائج

 python tools/gather_result.py --condition "{'tag': 'exp', 'task_name': 'sst-5', 'few_shot_type': 'prompt-demo'}"

سيقوم بجمع النتائج من log وحساب المتوسط والانحراف المعياري خلال تقسيمات اختبار التدريب الخمسة.

اتصالات

لأية أسئلة، يرجى الاتصال بالمؤلفين.

شكر وتقدير

شكرًا لـ LM-BFF وSupCon، على التطبيقات الأولية.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-01-07
الحجم 50MB
من Github

تطبيقات ذات صلة

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
node telegram bot api

كود الذكاء الاصطناعي

v0.50.0
typebot.io

كود الذكاء الاصطناعي

v3.1.2
python wechaty getting started

كود الذكاء الاصطناعي

1.0.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
wp functions

فئات أخرى

1.0.0
termwind

فئات أخرى

v2.3.0

أخبار ذات صلة الكل

LM SupCon

التعلم المقارن لمتعلمي اللغة المعتمدين على السرعة

متطلبات

تنزيل البيانات

تشغيل الضبط الدقيق لدينا

جمع النتائج

اتصالات

شكر وتقدير

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

إنتاج صفحة الويب الخاصة بالاعترافات عبر الإنترنت من LM PHP، النسخة الجميلة، النسخة الرسمية، كود مصدر PHP

chat.petals.dev

GPT Prompt Templates

GPTyped

node telegram bot api

typebot.io

python wechaty getting started

waymo open dataset

wp functions

termwind