تنزيل llama classification - تنزيل كود مصدر llama classification

llama classification

كود الذكاء الاصطناعي

v1.1.1

تنزيل

تصنيف النص باستخدام LLaMA

يوفر هذا المستودع قاعدة بيانات أساسية لتصنيف النص باستخدام LLaMA.

ما هو النظام الذي أستخدمه للتطوير؟

الجهاز: Nvidia 1xV100 GPU
ذاكرة الجهاز: 34 جيجا
ذاكرة المضيف: 252 جيجا

إذا كنت بحاجة إلى معلومات أخرى حول الأجهزة، يرجى فتح مشكلة.

كيفية الاستخدام

الإعداد التجريبي

احصل على نقطة التفتيش من مستودع LLaMA الرسمي من هنا.
1-1. أفترض أن نقطة التفتيش ستكون موجودة في اتجاه جذر المشروع وسيتم ترتيب المحتويات على النحو التالي.
```
 checkpoints
├── llama
│   ├── 7B
│   │   ├── checklist.chk
│   │   ├── consolidated.00.pth
│   │   └── params.json
│   └── tokenizer.model
```

قم بإعداد بيئة بايثون الخاصة بك. أوصي باستخدام اناكوندا لفصل إصدار CUDA الخاص بجهازك المحلي.

conda create -y -n llama-classification python=3.8
conda activate llama-classification
conda install cudatoolkit=11.7 -y -c nvidia
conda list cudatoolkit # to check what cuda version is installed (11.7)
pip install -r requirements.txt

الطريقة : مباشر

Direct هو مقارنة الاحتمال الشرطي p(y|x) .

المعالجة المسبقة للبيانات من مجموعات بيانات Huggingface باستخدام البرامج النصية التالية. من الآن فصاعدا، نستخدم مجموعة بيانات ag_news.
```
python run_preprocess_direct_ag_news.py
python run_preprocess_direct_ag_news.py --sample=False --data_path=real/inputs_direct_ag_news.json # Use it for full evaluation
```

الاستدلال لحساب الاحتمال الشرطي باستخدام LLaMA والتنبؤ بالفئة.

torchrun --nproc_per_node 1 run_evaluate_direct_llama.py 
    --data_path samples/inputs_direct_ag_news.json 
    --output_path samples/outputs_direct_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

Calibration هي تحسين الطريقة المباشرة بطريقة المعايرة.

معايرة باستخدام الأمر التالي.

torchrun --nproc_per_node 1 run_evaluate_direct_calibrate_llama.py 
    --direct_input_path samples/inputs_direct_ag_news.json 
    --direct_output_path samples/outputs_direct_ag_news.json 
    --output_path samples/outputs_direct_calibrate_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

الطريقة : قناة

Channel هي مقارنة الاحتمال الشرطي p(x|y) .

المعالجة المسبقة للبيانات من مجموعات بيانات Huggingface باستخدام البرامج النصية التالية. من الآن فصاعدا، نستخدم مجموعة بيانات ag_news.
```
python run_preprocess_channel_ag_news.py
python run_preprocess_channel_ag_news.py --sample=False --data_path=real/inputs_channel_ag_news.json # Use it for full evaluation
```

الاستدلال لحساب الاحتمال الشرطي باستخدام LLaMA والتنبؤ بالفئة.

torchrun --nproc_per_node 1 run_evaluate_channel_llama.py 
    --data_path samples/inputs_channel_ag_news.json 
    --output_path samples/outputs_channel_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

الطريقة: توليد نقي

للتقييم باستخدام وضع generate ، يمكنك استخدام الإصدار المباشر الذي تمت معالجته مسبقًا.

torchrun --nproc_per_node 1 run_evaluate_generate_llama.py 
    --data_path samples/inputs_direct_ag_news.json 
    --output_path samples/outputs_generate_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

التجارب

مجموعة البيانات	num_examples	ك	طريقة	دقة	وقت الاستدلال
ag_news	7600	1	مباشر	0.7682	00:38:40
ag_news	7600	1	مباشر + معايرة	0.8567	00:38:40
ag_news	7600	1	قناة	0.7825	00:38:37

قائمة المهام

تنفيذ طريقة القناة
تقرير تجريبي
- مباشر
- قناة
- جيل
تنفيذ طريقة المعايرة الأخرى
دعم مجموعة البيانات الأخرى داخل مجموعات البيانات المعانقة
تنفيذ LLM.int8
مقياس تقييم آخر لقياس الخصائص المختلفة لنموذج الأساس (LLaMA)

الملاحظة النهائية

أنا أقدر حقًا قيام فريق مشروع LLaMA بنشر نقطة تفتيش ورمز الاستدلال الفعال الخاص بهم. يتم تنفيذ الكثير من العمل في هذا المستودع بناءً على المستودع الرسمي.
وللقارئ لا تتردد في فتح العدد أو سحب الطلبات. يمكنك أن تعطيني ..
- أي مشكلة تتعلق بطلبات الميزات الأخرى
- أي مشكلة حول التنفيذ التفصيلي
- أي مناقشة حول اتجاه البحث

الاقتباس

سيكون موضع ترحيب الاستشهاد بعملي إذا كنت تستخدم قاعدة التعليمات البرمجية الخاصة بي لبحثك.

 @software{Lee_Simple_Text_Classification_2023,
    author = {Lee, Seonghyeon},
    month = {3},
    title = {{Simple Text Classification Codebase using LLaMA}},
    url = {https://github.com/github/sh0416/llama-classification},
    version = {1.1.0},
    year = {2023}
}

يوسع

معلومات إضافية

الإصدار v1.1.1
النوع كود الذكاء الاصطناعي
وقت التحديث 2024-12-10
الحجم 2.5MB
من Github

تطبيقات ذات صلة

node llama cpp

2024-11-11
llama models

2024-11-10
LLaMA Factory

2024-11-02
كود لاما

2023-10-30
كود لاما موديل كبير

2023-08-25
اللاما 2

2023-08-17

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
node telegram bot api

كود الذكاء الاصطناعي

v0.50.0
typebot.io

كود الذكاء الاصطناعي

v3.1.2
python wechaty getting started

كود الذكاء الاصطناعي

1.0.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل