ملاحظة : تم الانتهاء من OpenAssistant ، ويتم الانتهاء من المشروع الآن. شكرا لكل من ساهم! تحقق من منشور المدونة لدينا لمزيد من المعلومات. يمكن العثور على مجموعة بيانات OASST2 المنشورة النهائية على Huggingface في OpenAssistant/OASST2
مساعد Open هو مشروع يهدف إلى منح الجميع إمكانية الوصول إلى نموذج لغة كبير قائم على الدردشة.
نحن نعتقد أنه من خلال القيام بذلك ، سنخلق ثورة في الابتكار في اللغة. بنفس الطريقة التي ساعدت بها الانتشار المستقر العالم على صنع الفن والصور بطرق جديدة نأمل أن يساعد المساعد المفتوح في تحسين العالم من خلال تحسين اللغة نفسها.
جمع البيانات
محادثة
وثائق المشروع
إن الواجهة الأمامية للدردشة تعيش الآن هنا. تسجيل الدخول وابدأ الدردشة! يرجى محاولة الرد مع إبهام لأعلى أو لأسفل للحصول على ردود المساعد عند الدردشة.
إن الواجهة الأمامية لجمع البيانات تعيش الآن هنا. تسجيل الدخول وابدأ في أخذ المهام! نريد جمع كمية كبيرة من بيانات الجودة. من خلال تقديم وتصنيف وتصنيف نموذج النموذج والردود ، ستساعد مباشرة على تحسين قدرات المساعد المفتوح.
لا تحتاج إلى تشغيل المشروع محليًا إلا إذا كنت تساهم في عملية التطوير. سوف يأخذك رابط الموقع أعلاه إلى موقع الويب العام حيث يمكنك استخدام تطبيق جمع البيانات والدردشة.
إذا كنت ترغب في تشغيل تطبيق جمع البيانات محليًا للتطوير ، فيمكنك إعداد مكدس كامل مطلوب لتشغيل المساعد المفتوح ، بما في ذلك الموقع الإلكتروني والخلفية والخدمات المعتمدة المرتبطة به ، مع Docker.
لبدء العرض التوضيحي ، قم بتشغيل هذا في الدليل الجذر للمستودع (تحقق من هذه الأسئلة الشائعة إذا كانت لديك مشاكل):
docker compose --profile ci up --build --attach-dependencies
ملاحظة: عند التشغيل على MacOS مع شريحة M1 ، عليك استخدام:
DB_PLATFORM=linux/x86_64 docker compose ...
بعد ذلك ، انتقل إلى http://localhost:3000
(قد يستغرق الأمر بعض الوقت للتمهيد) والتفاعل مع الموقع.
ملاحظة: إذا حدثت مشكلة مع البناء ، فيرجى التوجه إلى الأسئلة الشائعة والتحقق من الإدخالات حول Docker.
ملاحظة: عند تسجيل الدخول عبر البريد الإلكتروني ، انتقل إلى
http://localhost:1080
للحصول على رابط تسجيل الدخول إلى البريد الإلكتروني السحري.
ملاحظة: إذا كنت ترغب في تشغيل هذا في بيئة تطوير موحدة ("DevContainer") باستخدام VSCode محليًا أو في متصفح الويب باستخدام مساحات رموز Github ، يمكنك استخدام مجلد
.devcontainer
المتوفر.
لا تحتاج إلى تشغيل المشروع محليًا إلا إذا كنت تساهم في عملية التطوير. سوف يأخذك رابط الموقع أعلاه إلى موقع الويب العام حيث يمكنك استخدام تطبيق جمع البيانات والدردشة.
لاحظ أيضًا أن الإعداد المحلي مخصص للتطوير فقط ولا يُقصد به استخدامه كدردشة محلية ، إلا إذا كنت تعرف ما تفعله.
إذا كنت تعرف ما الذي تفعله ، فاستشر مجلد inference
للحصول على نظام الاستدلال قيد التشغيل ، أو إلقاء نظرة على --profile inference
-بالإضافة إلى --profile ci
في الأمر أعلاه.
لن نتوقف عند تكرار ChatGpt. نريد أن نبني مساعد المستقبل ، ولا قادرون على كتابة رسائل البريد الإلكتروني والغطاء فحسب ، بل القيام بعمل ذي معنى ، واستخدام واجهات برمجة التطبيقات ، والمعلومات البحثية ديناميكيًا ، وأكثر من ذلك بكثير ، مع القدرة على التخصيص وتوسيعها من قبل أي شخص. ونريد أن نفعل ذلك بطريقة مفتوحة ويمكن الوصول إليها ، مما يعني أنه لا يجب علينا بناء مساعد رائع فحسب ، بل نجعله أيضًا صغيرًا وفعالًا بما يكفي لتشغيله على أجهزة المستهلك.
يمكننا بعد ذلك أخذ النموذج الناتج والمتابعة مع الانتهاء من أخذ العينات الخطوة 2 للتكرار التالي.
الرؤية وخريطة الطريق
هياكل بيانات مهمة
تبدأ جميع مشاريع المصادر المفتوحة بأشخاص مثلك. المصدر المفتوح هو الاعتقاد بأنه إذا تعاوننا ، فيمكننا معًا هدية معرفتنا وتكنولوجيانا للعالم لصالح الإنسانية.
تحقق من دليلنا المساهمة للبدء.