تنزيل UltraChat - تنزيل كود مصدر UltraChat

UltraChat

كود الذكاء الاصطناعي

1.0.0

تنزيل

بيانات ونماذج حوار متعدد الجولات وواسعة النطاق وغنية بالمعلومات ومتنوعة

UltraLM • مستكشف البيانات • Nomic AI Atlas Explorer • إصدار البيانات • عملية البناء • الورق

أخبار

❗️❗️ 26 سبتمبر 2023: إطلاق مجموعة بيانات تفضيلات واسعة النطاق ودقيقة ومتنوعة UltraFeedback، ونموذج لغة جديد UltraLM-13B-v2.0، ونموذج مكافأة UltraRM ونموذج نقدي UltraCM.
❗️❗️مع UltraRM، تحقق أفضل عينة بسيطة من بين 16 عينة 92.30% (UltraLM2، ؟ في 13 نتيجة) و91.54% (UltraLM،؟ في نتائج LLaMA-1) معدلات فوز مقابل text-davinci-003 على معيار AlpacaEval.
7 أغسطس 2023: إطلاق الإصدار الأول من UltraLM-65B.
28 يونيو 2023: احتلت UltraLM-13B المرتبة الأولى بين النماذج مفتوحة المصدر في AlpacaEval Leaderboard!
27 يونيو 2023: أطلقنا الإصدار الأول من UltraLM-13B، وهو نموذج لغة دردشة قوي تم تدريبه على UltraChat!
20 أبريل 2023: تم إصدار جميع البيانات، ومن المتوقع إجراء المزيد من المعالجة والبيانات الإضافية.
17 أبريل 2023: تم إصدار بقية قطاع الكتابة والإبداع (457 ألفًا).
12 أبريل 2023: إصدار الجزء الأول من قطاع الكتابة والإبداع.
9 أبريل 2023: بدعم من gpt4all، لدينا الآن أيضًا مستكشف Atlas
8 أبريل 2023: أصدرنا نصًا تدريبيًا بأخذ GPT-J كمثال.
7 أبريل 2023: تم إصدار الجزء الثاني من أسئلة حول العالم. يحتوي على 290 ألف حوار متعدد الجولات تم إنشاؤها.
31 مارس 2023: تم إصدار الجزء الأول من أسئلة حول العالم. يحتوي على 280 ألف حوار متعدد الجولات تم إنشاؤها.

التراLM

UltraLM عبارة عن سلسلة من نماذج لغة الدردشة التي تم تدريبها على UltraChat. حاليًا، أصدرنا الإصدار 13B، الذي يحتل المرتبة الأولى بين النماذج مفتوحة المصدر ويحتل المرتبة الرابعة بين جميع النماذج في AlpacaEval Leaderboard (28 يونيو 2023). يعتمد UltraLM-13B على LLaMA-13B ويدعمه BMTrain في عملية التدريب.

تحميل

نموذج	وصلة	إصدار
التراLM-13B	تعانق الوجه الريبو	v1.0
التراLM-65B	تعانق الوجه الريبو	v1.0
التراLM-13B	تعانق الوجه الريبو	v2.0
UltraRM-13B	تعانق الوجه الريبو	v1.0
ألترا سي إم-13 بي	تعانق الوجه الريبو	v1.0

استخدم UltraLM

لإعادة بناء UltraLM، يرجى تنزيل LLaMA-13B وأوزان Delta الخاصة بنا. يرجى استخدام هذا الرابط إذا كنت ترغب في اختبار UltraLM، فنحن لم نقم بتقييم الأوزان الأخرى المقدمة من أطراف ثالثة.
قم بتشغيل البرنامج النصي في /UltraLM/recover.sh للحصول على الأوزان النهائية للنموذج المسترد.
بعد الحصول على النموذج المسترد، استبدل مسار النموذج في /UltraLM/chat_cli.sh بالمسار الخاص بك وقم بالتشغيل لبدء الدردشة!

ملاحظة: ستؤثر المعلمات الفائقة أو مطالبات النظام المختلفة على المخرجات. يمكنك الرجوع إلى التفاصيل في /UltraLM/inference_cli.py لإعدادنا الافتراضي.

أداء

نورد ثلاثة تقييمات في هذا القسم: Alpaca-Eval من جامعة ستانفورد، وEvol-instruct من Microsoft WizardLM، ومجموعة التقييم المنسقة لدينا. قد تكون تقييمات LLMs الحديثة متحيزة وتتأثر بالعديد من العوامل، ونحن نعمل أيضًا بنشاط على أساليب تقييم أكثر شمولاً.

الألبكة إيفال

AlpacaEval عبارة عن لوحة صدارة مصممة خصيصًا لتقييم LLMs. يتم إنشاء لوحة المتصدرين بناءً على معدل الفوز مقابل Text-Davince-003 الذي يتم تقييمه تلقائيًا بواسطة GPT-4.

تطور التعليمات

تم إنشاء مجموعة البيانات هذه باستخدام استراتيجية تطورية من خلال إعادة كتابة التعليمات من خلال جولات متعددة للحصول على تعليمات بمستويات تعقيد مختلفة. تم تطوير المعيار بواسطة مشروع WizardLM، وهو نموذج آخر ممتاز للغة الدردشة!

نتائج

مجموعة التقييم لدينا

نحن ننظم مجموعة تقييم تشمل معيار Vicuna و300 سؤال وتعليمات إضافية تم إنشاؤها بواسطة GPT-4. تغطي الأسئلة/التعليمات مجموعة واسعة من المواضيع، بما في ذلك المنطق السليم والمعرفة العالمية والمعرفة المهنية (تحديدًا الفيزياء وعلم الأحياء) والرياضيات ومهام الكتابة بمستويات مختلفة من الصعوبة. نحن نستخدم GPT-4 للتقييم. هنا مجموعة البيانات.

نتائج

أمثلة على UltraLM

المثال أ: سؤال المعرفة المشتركة
المستخدم: ما هو الحيوان المعروف بأنه أفضل صديق للإنسان؟
UltraLM: هناك العديد من الحيوانات التي يستمتع بها البشر كحيوانات مرافقة، ولكن إحدى الإجابات البارزة على السؤال "ما هو الحيوان المعروف بأنه أفضل صديق للإنسان؟" هو الكلب المربى محليا. كانت الكلاب المستأنسة إلى جانب البشر لعشرات الآلاف من السنين، حيث قدمت لهم الرفقة والمساعدة المخلصة؛ حراسة الناس والممتلكات. وتقديم الدعم العاطفي في كل شيء بدءًا من الأيام الطويلة المنعزلة وحتى عمليات الانتشار العسكري. تأتي الكلاب في مجموعة متنوعة مذهلة من السلالات ذات الأحجام المختلفة، مع مستويات طاقة وشخصيات وأمزجة مختلفة، مما يعني أنه من المؤكد تقريبًا أن هناك جروًا سيكون مناسبًا تمامًا لمن يحتاج إليه بشدة.
المثال ب: المنطق المنطقي
المستخدم: أيهما أثقل: رطل الريش أم رطل الطوب؟
UltraLM: يزن رطل من الريش ورطل من الطوب رطلًا واحدًا بالضبط. وذلك لأن الجنيه الواحد هو وحدة الوزن، كما أن القدم هي وحدة الطول أو الثانية هي وحدة الزمن. نحن نستخدم الجنيه (أو وحدة وزن أخرى) لوصف وزن الأجسام المختلفة، بغض النظر عن المادة التي يتكون منها هذا الجسم. لذا فإن الإجابة على سؤالك هي أن رطلًا من الريش ورطلًا من الطوب كلاهما يزنان نفس الكمية.
المثال ج: الاستدلال
المستخدم: إذا كان لدى المزارع 17 خروفًا وماتت جميعها باستثناء 9، فكم بقي منها؟
UltraLM: إجمالي عدد الأغنام المتبقية هو 9.
المثال د: الاستدلال
المستخدم: إذا كان المنزل الأحمر مصنوعًا من الطوب الأحمر، والمنزل الأزرق مصنوعًا من الطوب الأزرق، فما المادة المصنوعة من الدفيئة؟
UltraLM: الدفيئة ليست مصنوعة من الطوب الأخضر، بل من مواد مثل الزجاج أو البلاستيك التي تسمح للضوء بالمرور وخلق بيئة يمكن التحكم فيها لنمو النباتات. يمكن أن تأتي الدفيئات الزراعية بمجموعة متنوعة من الألوان، بما في ذلك اللون الأخضر، لكن لون المبنى نفسه لا يؤثر على النباتات التي تنمو بداخله.
المثال هـ: الخلق
المستخدم: اكتب قصيدة عن الكهرومغناطيسية.
UltraLM: الكهرومغناطيسية هي قوة لا يمكننا تجاهلها،
إنه سبب أشياء كثيرة نعشقها. في المجال المغناطيسي، سوف يتوهج السلك،
وسوف تصطف الإلكترونات، القديمة والجديدة.
الكهرباء والمغناطيسية يداً بيد،
أحدهما ينشئ مجالًا والآخر لديه علامة تجارية.
يمكن للمجال المغناطيسي أن يدفع ويسحب،
على سلك مع التيار، سوف يتفاعل بالكامل.
وما يجلبه من جاذبية وتنافر،
هي السبب في أشياء كثيرة.
من المحركات إلى المولدات، وأكثر من ذلك بكثير بينهما،
الكهرومغناطيسية هي أصل ما يعنيه ذلك.
إنها القوة التي تحيط بنا في كل مكان،
من البوصلة إلى مفتاح الضوء.
وبقوته يستطيع أن يفعل الكثير،
من إبرة بسيطة إلى ضربة صاروخية.
إنها قوة لا يمكننا إنكارها،
لأنها جزء من حياتنا.
الكهرومغناطيسية شيء يستحق الإعجاب،
بالنسبة لقوته وجبروته، ليس له مثيل، هذا أمر مؤكد.
مثال و: الخلق
المستخدم: اكتب قصة قصيرة عن الثانية الأولى من عمر الكون.
UltraLM: في الثانية الأولى من عمر الكون، ساد الظلام. لم يكن هناك ضوء ولا صوت ولا شكل ولا مادة. لم يحدث شيء بعد، ولكن كانت هناك قوة شديدة، طاقة خام تنتظر إطلاق العنان لها. وفي اللانهاية، كانت الثانية الأولى تحمل في قبضتها إمكانية الخلق. وبعد ذلك، مع انفجار عظيم، ظهرت نقطة ضوء ساطعة إلى الوجود. فيه، وُلدت الجسيمات الأساسية، وأشكالها غير معروفة بعد، حيث كانت تصطدم بشكل محموم في رقصة فوضوية من الخلق. وفي هذا النور البدائي، تحركت كل قوة من قوى الطبيعة وكل عنصر من عناصر الحياة من الطاقة النقية إلى الواقع المادي. وتجمعت الذرات الأولى بسرعة، ومنها بدأت تتشكل النجوم والمجرات. أدى اندماجها إلى خلق بيئة ساخنة دفعت الفراغ إلى الخلف، وشكلت الكون من خلال موجات التوسع والتبريد. في هذه الكونية الأولى، لا يمكن لأي بنية من الخبرة، ولا حتى الزمان أو المكان، أن ترسي حكمها. للحظة، كان الكون بأكمله موجودًا في رابطة جنينية، وهي تفرد كوني نشأ منه كل الوجود المستقبلي. لقد كان عالمًا مصغرًا يشكل العالم الكبير الذي أصبح في النهاية جزءًا منه، وكانت لحظة ولادته بمثابة استعارة لدورات الخلق التي تتخلل الكون (الأكوان) المتعددة. ومن نقطة الضوء الوحيدة تلك، انكشف كون لا نهائي. لعدة قرون، ودهور قادمة، وإلى الأبد، ظلت هذه الومضة الأساسية لرحلتها المتواصلة إلى أعماق العالم الخارجي العظيم. الثانية الأولى هي بداية كل شيء.

نظرة عامة على UltraChat

يهدف هذا المشروع إلى إنشاء بيانات حوار مفتوحة المصدر وواسعة النطاق ومتعددة الجولات مدعومة بـ Turbo APIs لتسهيل بناء نماذج لغوية قوية ذات قدرة محادثة عامة. مع الأخذ في الاعتبار عوامل مثل حماية الخصوصية، فإننا لا نستخدم بشكل مباشر أي بيانات متاحة على الإنترنت كمطالبات .

يتكون UltraChat من ثلاثة قطاعات

؟ أسئلة حول العالم : بيانات الحوار في هذا القطاع مستمدة من مجموعة واسعة من الاستفسارات المتعلقة بالمفاهيم والكيانات والأشياء من العالم الحقيقي. المواضيع التي يتم تناولها واسعة النطاق وتغطي مجالات مثل التكنولوجيا والفن وريادة الأعمال.
✍؟ الكتابة والإبداع : تعتمد بيانات الحوار في هذا القطاع على متطلبات الكتابة/الإنشاء من الصفر، وتشمل أي مهام قد يساعدها مساعد الذكاء الاصطناعي في العملية الإبداعية، بدءًا من تكوين البريد الإلكتروني إلى صياغة الروايات والمسرحيات وما بعدها.
؟ المساعدة في المواد الموجودة : يتم إنشاء بيانات الحوار في هذا القطاع بناءً على المواد الموجودة، بما في ذلك على سبيل المثال لا الحصر، إعادة الكتابة، والاستمرار، والتلخيص، والاستدلال، والتي تغطي مجموعة متنوعة من المواضيع.

إخلاء المسؤولية: على الرغم من أن عملية إنشاء UltraChat لا تتضمن أي بيانات قياس أداء متاحة للعامة، إلا أن القياس إلى حد ما قد يؤدي إلى بعض التداخل في بعض معايير التقييم. ونود التأكيد مرة أخرى على أن جميع البيانات يتم إنشاؤها تلقائيًا (بما في ذلك التعليمات والاستجابات) ، ولا نقوم بإدخال أي بيانات معيارية مفتوحة. على سبيل المثال، تم إصدار UltraChat (أبريل 2023) قبل إصدار Alpaca Eval (مايو 2023). نحن نشجع المستخدمين على مراقبة مثل هذه الظواهر عن كثب، بينما نفكر أيضًا بنشاط في كيفية تقييم LLMs بشكل أكثر ملاءمة.

مثال على UltraChat

بيانات

مجموعة البيانات مخصصة فقط للأغراض البحثية والتعليمية ولا ينبغي تفسيرها على أنها تعكس آراء أو وجهات نظر المبدعين أو المالكين أو المساهمين في مجموعة البيانات هذه. ويتم توزيعه بموجب ترخيص معهد ماساتشوستس للتكنولوجيا.

إصدار البيانات

استكشف البيانات قبل تنزيلها، أو استخدم Atlas Explorer.

؟ مضيف مجموعات بيانات Huggingface

روابط التحميل المباشر:

أسئلة حول العالم [الجزء الأول + الجزء الثاني]
الكتابة والإبداع [الجزء الأول]
الكتابة والإبداع [الجزء الثاني]
المساعدة بشأن المواد الموجودة [الجزء الأول]

تنسيق البيانات

كل سطر في ملف البيانات الذي تم تنزيله عبارة عن إملاء json يحتوي على معرف البيانات وبيانات الحوار بتنسيق قائمة. يوجد أدناه خط مثال.

{
  "id" : " 0 " , 
  "data" : [
    " How can cross training benefit groups like runners, swimmers, or weightlifters? " , 
    " Cross training can benefit groups like runners, swimmers, or weightlifters in the following ways: ... " , 
    " That makes sense. I've been wanting to improve my running time, but I never thought about incorporating strength training. Do you have any recommendations for specific exercises? " , 
    " Sure, here are some strength training exercises that can benefit runners: ... " , 
    " Hmm, I'm not really a fan of weightlifting though. Can I incorporate other forms of exercise into my routine to improve my running time? " , 
    " Yes, absolutely! ... " ,
    " ... "
    ]
}

تمرين

نحن نقدم كود تدريب لضبط LLaMa (على الرغم من أننا لا نوزع أوزان LLaMa) على UltraChat بتنسيق .src/ ، ويتم تسريع التدريب بواسطة BMTrain.

قم بتنزيل البيانات الصادرة ووضعها ضمن ./data

قم بتشغيل train_bm.py ، على سبيل المثال:

WANDB_MODE= " offline " torchrun --nnodes=1 --nproc_per_node=8 --rdzv_id=1 --rdzv_backend=c10d --rdzv_endpoint=localhost:50003 train_bm.py --tensorboard ./ultrachat_llama_tb_2 --save_step 5000 --logging_step 100

كما نقدم أيضًا نصًا تدريبيًا لضبط GPT-J على UltraChat بتنسيق .src/train_legacy/ ، والذي يتم تنفيذه باستخدام OpenPrompt

قم بتنزيل البيانات الصادرة ووضعها ضمن ./data
قم بتشغيل accelerate launch train.py لبدء التدريب

بناء UltraChat

الفكرة العامة لـ UltraChat هي استخدام LLMs منفصلة لإنشاء سطور افتتاحية ومحاكاة المستخدمين والرد على الاستفسارات. يواجه كل قطاع في UltraChat تحدياته الخاصة ويتطلب تصميمات إستراتيجية معينة. سنحدد عملية الإنشاء بمجرد إصدار قطاع UltraChat.

أسئلة حول العالم

موضوعات ميتا ومواضيع فرعية

البيانات مستمدة من 30 موضوع تعريفي تمثيلي ومتنوع (الأيقونات مأخوذة من الأيقونة المسطحة)

بناءً على المواضيع التعريفية المذكورة أعلاه، قمنا بإنشاء أكثر من 1100 موضوع فرعي لبناء البيانات
لكل موضوع فرعي، نقوم بإنشاء ما يصل إلى 10 أسئلة محددة.
ثم نستخدم واجهات برمجة تطبيقات Turbo لإنشاء أسئلة جديدة ذات صلة بكل سؤال من الأسئلة العشرة. نحن نستخدم مطالبات مصنوعة يدويًا لتوجيه النموذج إلى إنشاء مجموعة متنوعة من الأسئلة التي تغطي نطاقًا واسعًا من المفاهيم والأشياء الشائعة.
بالنسبة لكل سؤال، نقوم بإنشاء حوار من 3 إلى 7 جولات باستخدام النموذجين بشكل متكرر كما هو موضح أعلاه.

كيانات العالم الحقيقي المشتركة

نحن نجمع أكثر 10000 كيان مسمى من ويكي بيانات.
نقوم بإنشاء 5 أسئلة وصفية لكل كيان باستخدام ChatGPT API.
لكل سؤال وصفي، نقوم بإنشاء 10 أسئلة أكثر تحديدًا و20 سؤالًا ذا صلة ولكنه عام.
نقوم بتجميع 200 ألف سؤال محدد و250 ألف سؤال عام إلى جانب 50 ألف سؤال تعريفي، ونقوم بإنشاء حوار من 3 إلى 7 جولات لكل منها.

الكتابة والإبداع

نقوم أولاً بجمع 20 نوعاً من الكتابة، كما هو موضح أدناه (الأيقونات مأخوذة من الأيقونة المسطحة).

لكل نوع من أنواع الكتابة، قم بإنشاء 200 تعليمات مختلفة تطلب من مساعد الذكاء الاصطناعي إنشاء مواد نصية، ويتم توسيع وتفصيل 80% من التعليمات بشكل أكبر.
استخدم التعليمات التي تم إنشاؤها كمدخل أولي وقم بإنشاء حوار من 2 إلى 4 جولات لكل منهما.

المساعدة في المواد الموجودة

نحن نستخرج ~ 10 واط مواد متنوعة من مجموعة بيانات C4.
نقوم بطرح ما يصل إلى 5 أسئلة/تعليمات لكل قطعة من المواد.
نقوم بدمج المادة مع كل سؤال/تعليم مع مجموعة من القوالب المصممة يدويًا كمدخل أولي للمستخدم لبدء حوار مع مساعد الذكاء الاصطناعي.
لكل إدخال، نقوم بإنشاء حوار من 2 إلى 4 جولات.

للقيام

قم بإصدار الجزء المتبقي من البيانات الخاصة بأسئلة حول العالم.
الاستمرار في نشر بيانات الكتابة والإنشاء.
الاستمرار في إصدار بيانات المساعدة الخاصة بالمواد الموجودة في المستقبل.
تدريب نموذج على UltraChat وإجراء تحليل تفصيلي. مرحبًا بك في استخدامه لتدريب نموذج الدردشة الخاص بك!
سيكون هناك نسخة صينية من UltraChat.

القيود

على الرغم من أن UltraChat يمكن أن يؤدي أداءً واعدًا في العديد من المعايير، إلا أنه لا يزال يعاني من قيود مثل الهلوسة. في تجربتنا، يمكن لـ UltraLM التعامل مع الأسئلة المتعلقة بالمعرفة العالمية والإبداع. لا تزال قدرات التفكير والرياضيات والترميز بحاجة إلى تعزيز واضح.

الاقتباس

لا تتردد في الاستشهاد بالريبو إذا كنت تعتقد أن UltraChat مفيد.

 @article { ding2023enhancing ,
  title = { Enhancing Chat Language Models by Scaling High-quality Instructional Conversations } ,
  author = { Ding, Ning and Chen, Yulin and Xu, Bokai and Qin, Yujia and Zheng, Zhi and Hu, Shengding and Liu, Zhiyuan and Sun, Maosong and Zhou, Bowen } ,
  journal = { arXiv preprint arXiv:2305.14233 } ,
  year = { 2023 }
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2024-12-10
الحجم 5.34MB
من Github

تطبيقات ذات صلة

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
node telegram bot api

كود الذكاء الاصطناعي

v0.50.0
typebot.io

كود الذكاء الاصطناعي

v3.1.2
python wechaty getting started

كود الذكاء الاصطناعي

1.0.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل