الصينية-ChatBot/chatbot الصينية
- وقد نقل المؤلف بالكامل إلى
GNN الرسم البياني اتجاه الشبكة العصبية لن يتابع تطوير C++ البرمجة اللغوية العصبية بعد الآن، وسيتوقف الحفاظ على رمز المشروع. عندما اكتمل مشروع Yuanxiang، كان هناك عدد قليل جدًا من الموارد عبر الإنترنت، وقد تواصل المؤلف مع البرمجة اللغوية العصبية والتعلم العميق لأول مرة بسبب نزوة للتغلب على العديد من الصعوبات، وأخيراً كتب نموذج اللعبة هذا. لذلك، يعلم المؤلف أن الأمر ليس سهلاً للمبتدئين، لذلك حتى لو لم يعد المشروع قيد الصيانة، فسيتم الرد على المشكلات أو رسائل البريد الإلكتروني ([email protected]) في الوقت المناسب لمساعدة القادمين الجدد إلى التعلم العميق. (إصدار Tensorflow الذي أستخدمه قديم جدًا. إذا قمت بتشغيل الإصدار الجديد مباشرةً، فستحصل بالتأكيد على أخطاء متنوعة. إذا واجهت صعوبات، فلا تهتم بتثبيت الإصدار القديم من البيئة. يوصى باستخدام Pytorch لإعادة بنائه وفقًا لمنطق المعالجة الخاص بي، فأنا كسول جدًا في الكتابة).
- جانب GNN:
- مجموعة من نماذج المقارنة المرجعية: تم تكييف وتجميع GNNs-Baseline لتسهيل التحقق السريع من الأفكار.
- كود المصدر المفتوح لورقتي ACMMM 2023 (CCF-A) موجود هنا LSTGM.
- لا يزال كود المصدر المفتوح لورقتي ICDM 2023 (CCF-B) قيد التجميع. . . GRN
- الزملاء مدعوون للإضافة والتواصل والتعلم.
تكوين البيئة
برنامج | إصدار |
---|
بيثون | 3.68 |
com.tensorflow | 1.13.1 |
كيراس | 2.2.4 |
windows10 | |
jupyter | |
المواد المرجعية الرئيسية
- الأطروحة "الترجمة الآلية العصبية من خلال التعلم المشترك للمحاذاة والترجمة ( انقر على العنوان للتنزيل )"
- مخطط هيكل الانتباه
النقاط الرئيسية
- LSTM
- seq2seq
- تظهر تجارب الانتباه أنه بعد إضافة آلية الانتباه، تكون سرعة التدريب أسرع، ويكون التقارب أسرع، ويكون التأثير أفضل.
الجسم وبيئة التدريب
تم تدريب 100.000 مجموعة حوار من مجموعة Qingyun بالتعاون مع Google.
يجري
الطريقة الأولى: إكمال العملية
- المعالجة المسبقة للبيانات
get_data
- التدريب النموذجي
chatbot_train
(هذا هو الإصدار المثبت على google colab، يحتاج مسار التشغيل المحلي إلى تعديل طفيف)
- التنبؤ النموذجي
chatbot_inference_Attention
الطريقة الثانية: تحميل نموذج موجود
- قم بتشغيل
chatbot_inference_Attention
-
models/W--184-0.5949-.h5
واجهة (تكينتر)
تصور وزن الاهتمام
آخر
- في ملف التدريب chat_bot، يتم استخدام أول كتلتين من الكتل الثلاثة الأخيرة من التعليمات البرمجية لتركيب Google Cloud Disk، ويتم استخدام الكتلة الأخيرة للحصول على تلك الخسائر لتسهيل الرسم. لا أعرف سبب استخدام Tensorbord في وظيفة رد الاتصال لا تعمل، لذلك توصلت إلى هذه الاستراتيجية؛
- تحتوي الكتلة قبل الأخيرة من التعليمات البرمجية في ملف التنبؤ فقط على إدخال نص ولكن لا توجد واجهة. يمكن تشغيل إحدى الكتلتين على الفور وفقًا للاحتياجات.
- هناك الكثير من المخرجات الوسيطة في الكود، وآمل أن تساعدك على فهم الكود؛
- يوجد نموذج قمت بتدريبه على النماذج، ولا ينبغي أن تكون هناك مشكلة في التشغيل العادي.
- يتمتع المؤلف بقدرة محدودة ولم يعثر على مؤشر لقياس تأثير الحوار، لذا فإن الخسارة يمكن أن تعكس تقدم التدريب بشكل تقريبي فقط.