تنزيل llama - تنزيل رمز المصدر llama

llama

شفرة المصدر الأخرى

تنزيل

ملاحظة من الإهمال

شكرا لك على تطوير نماذج لاما. كجزء من إصدار Llama 3.1 ، قمنا بتوحيد repos Github وأضفنا بعض عمليات إعادة الشراء الإضافية حيث قمنا بتوسيع وظائف Llama إلى كونها مكدس E2E Llama. الرجاء استخدام إعادة الشراء التالية للمضي قدمًا:

Llama -Models - REPO المركزي لنماذج الأساس بما في ذلك المرافق الأساسية وبطاقات النماذج والترخيص واستخدام السياسات
Purplamama - المكون الرئيسي لمكدس Llama يركز على مخاطر السلامة وتخفيف وقت الاستدلال
LLAMA-TOOLCHAIN-تطوير النموذج (الاستدلال/التثبيت/دروع السلامة/توليد البيانات الاصطناعية) واجهات وتطبيقات الكنسي
نظام Llama-Agentic-System-نظام مكدس Llama المستقل E2E ، إلى جانب الواجهة الأساسية التي تمكن من إنشاء تطبيقات الوكيل
Llama -Recipes - نصوص وتكاملات مدفوعة بالمجتمع

إذا كان لديك أي أسئلة ، فلا تتردد في تقديم مشكلة على أي من عمليات إعادة الشراء المذكورة أعلاه وسنبذل قصارى جهدنا للرد في الوقت المناسب.

شكرًا لك!

(تم إهماله) لاما 2

نحن نفتح قوة نماذج اللغة الكبيرة. أصبح Llama 2 الآن في متناول الأفراد والمبدعين والباحثين والشركات من جميع الأحجام حتى يتمكنوا من تجربة أفكارهم وابتكارها وتوسيع نطاقها بمسؤولية.

يتضمن هذا الإصدار أوزان نموذجية ورمز البدء لنماذج لغة LLAMA التي تم تدريبها مسبقًا وضبطها-تتراوح من 7B إلى 70B.

يهدف هذا المستودع إلى مثال أدنى لتحميل نماذج Llama 2 وتشغيل الاستدلال. لمزيد من الأمثلة التفصيلية التي تستفيد من الوجه المعانقة ، راجع لماشية Llama.

تحديثات بعد الإطلاق

انظر التحديثات. أيضًا للحصول على قائمة بتشغيل الأسئلة التي يتم طرحها بشكل متكرر ، انظر هنا.

تحميل

من أجل تنزيل أوزان النموذج والرمز المميز ، يرجى زيارة موقع META وقبول ترخيصنا.

بمجرد الموافقة على طلبك ، ستتلقى عنوان URL موقّع عبر البريد الإلكتروني. ثم قم بتشغيل البرنامج النصي Download.sh ، وتمرير عنوان URL المقدم عند مطالبة ببدء التنزيل.

المتطلبات المسبقة: تأكد من تثبيت wget و md5sum . ثم قم بتشغيل البرنامج النصي: ./download.sh .

ضع في اعتبارك أن الروابط تنتهي بعد 24 ساعة وكمية معينة من التنزيلات. إذا بدأت في رؤية أخطاء مثل 403: Forbidden ، فيمكنك دائمًا إعادة تكوين رابط.

الوصول إلى الوجه المعانقة

نحن نقدم أيضًا تنزيلات على وجه المعانقة. يمكنك طلب الوصول إلى النماذج من خلال الاعتراف بالترخيص وملء النموذج في بطاقة النموذج لإعادة الريبو. بعد القيام بذلك ، يجب أن تحصل على جميع طرز Llama من الإصدار (Code Llama ، Llama 2 ، أو Llama Guard) في غضون ساعة واحدة.

بداية سريعة

يمكنك متابعة الخطوات أدناه للاستعداد بسرعة وتشغيلها مع طرازات Llama 2. ستتيح لك هذه الخطوات تشغيل الاستدلال السريع محليًا. لمزيد من الأمثلة ، راجع مستودع وصفات Llama 2.

في Conda Env مع Pytorch / CUDA المتاح استنساخ وتنزيل هذا المستودع.
في تشغيل الدليل الأعلى:
```
pip install -e .
```
تفضل بزيارة موقع META والتسجيل لتنزيل النموذج/s.
بمجرد التسجيل ، ستحصل على بريد إلكتروني مع عنوان URL لتنزيل النماذج. ستحتاج إلى عنوان URL هذا عند تشغيل البرنامج النصي Download.sh.
بمجرد الحصول على البريد الإلكتروني ، انتقل إلى مستودع Llama الذي تم تنزيله وقم بتشغيل البرنامج النصي للتنزيل.
- تأكد من منح أذونات التنفيذ إلى البرنامج النصي download.sh
- خلال هذه العملية ، سيُطلب منك إدخال عنوان URL من البريد الإلكتروني.
- لا تستخدم خيار "Copy Link" ، بل تأكد من نسخ الرابط من البريد الإلكتروني يدويًا.
بمجرد تنزيل النموذج/S الذي تريده ، يمكنك تشغيل النموذج محليًا باستخدام الأمر أدناه:

torchrun --nproc_per_node 1 example_chat_completion.py 
    --ckpt_dir llama-2-7b-chat/ 
    --tokenizer_path tokenizer.model 
    --max_seq_len 512 --max_batch_size 6

ملحوظة

استبدل llama-2-7b-chat/ بالمسار إلى دليل نقطة التفتيش و tokenizer.model مع المسار إلى نموذج الرمز المميز.
يجب ضبط –nproc_per_node على قيمة MP للنموذج الذي تستخدمه.
اضبط المعلمات max_seq_len و max_batch_size حسب الحاجة.
يقوم هذا المثال بتشغيل example_chat_completion.py الموجود في هذا المستودع ولكن يمكنك تغيير ذلك إلى ملف .py مختلف.

الاستدلال

تتطلب النماذج المختلفة قيم مختلفة متوازية (MP):

نموذج	النائب
7 ب	1
13 ب	2
70 ب	8

تدعم جميع الطرز طول تسلسل ما يصل إلى 4096 رمزًا ، لكننا نقوم بتخصيص ذاكرة التخزين المؤقت وفقًا لقيم max_seq_len و max_batch_size . لذا اضبط تلك وفقًا لأجهزةك.

نماذج ما قبل

هذه النماذج ليست محايدة للدردشة أو الأسئلة والأجوبة. يجب أن تتم مطالبتها بحيث تكون الإجابة المتوقعة هي الاستمرار الطبيعي للمطالبة.

انظر example_text_completion.py للحصول على بعض الأمثلة. لتوضيح ، راجع الأمر أدناه لتشغيله باستخدام نموذج LLAMA-2-7B (يجب ضبط nproc_per_node على قيمة MP ):

 torchrun --nproc_per_node 1 example_text_completion.py 
    --ckpt_dir llama-2-7b/ 
    --tokenizer_path tokenizer.model 
    --max_seq_len 128 --max_batch_size 4

نماذج الدردشة التي تم ضبطها

تم تدريب النماذج التي تم ضبطها على تطبيقات الحوار. للحصول على الميزات والأداء المتوقعة لهم ، يجب اتباع تنسيق محدد محدد في chat_completion ، بما في ذلك INST و <<SYS>> العلامات ، ورموز BOS و EOS ، والمساحات البيضاء والخطوط بينهما (نوصي بالاتصال strip() على المدخلات لتجنب المساحات المزدوجة).

يمكنك أيضًا نشر مصنفات إضافية لتصفية المدخلات والمخرجات التي تعتبر غير آمنة. راجع repo-Recipes Llama للحصول على مثال على كيفية إضافة مدقق أمان إلى مدخلات ومخرجات رمز الاستدلال الخاص بك.

أمثلة باستخدام Llama-2-7b-Chat:

 torchrun --nproc_per_node 1 example_chat_completion.py 
    --ckpt_dir llama-2-7b-chat/ 
    --tokenizer_path tokenizer.model 
    --max_seq_len 512 --max_batch_size 6

Llama 2 هي تقنية جديدة تحمل مخاطر محتملة مع الاستخدام. الاختبار الذي أجري حتى الآن لم يكن - ولا يمكن - تغطية جميع السيناريوهات. من أجل مساعدة المطورين على معالجة هذه المخاطر ، أنشأنا دليل الاستخدام المسؤول. يمكن العثور على مزيد من التفاصيل في ورقة البحث لدينا أيضًا.

مشاكل

يرجى الإبلاغ عن أي برنامج "خطأ" ، أو مشاكل أخرى مع النماذج من خلال إحدى الوسائل التالية:

مشكلات الإبلاغ مع النموذج: github.com/facebookresearch/llama
الإبلاغ عن المحتوى المحفوف بالمخاطر الذي تم إنشاؤه بواسطة النموذج: المطورين. facebook.com/llama_output_feedback
الإبلاغ عن الأخطاء والمخاوف الأمنية: facebook.com/whitehat/info

بطاقة النموذج

انظر Model_card.md.

رخصة

نموذجنا وأوزاننا مرخصة لكل من الباحثين والكيانات التجارية ، مما يدعم مبادئ الانفتاح. تتمثل مهمتنا في تمكين الأفراد والصناعة من خلال هذه الفرصة ، مع تعزيز بيئة من الاكتشاف والتقدم الأخلاقي الذكاء الاصطناعي.

انظر ملف الترخيص ، وكذلك سياسة الاستخدام المقبولة المصاحبة لدينا