كود/بيانات لورقة NAACL'19 لتحسين التنوع والملاءمة بشكل مشترك في توليد الاستجابة العصبية
SpaceFusion هو نموذج تعليمي منتظم متعدد المهام مقترح لمواءمة وهيكلة المساحات الكامنة غير المنظمة التي تعلمتها نماذج مختلفة تم تدريبها على مجموعات بيانات مختلفة. ومما يثير الاهتمام بشكل خاص تطبيقه على نمذجة المحادثة العصبية، حيث يتم استخدام SpaceFusion لتحسين أهمية وتنوع الاستجابات المولدة.
المزيد من الوثائق:
ورقتنا في NAACL'19 (طويلة، شفهية).
الشرائح المقدمة في NAACL'19.
قمنا بنشر مدونة MSR لمناقشة الحدس والتضمين
أعمال المتابعة لدينا، StyleFusion في EMNLP'19
أحدث نماذجنا لتقييم/تصنيف الحوار، DialogRPT، في EMNLP'20
تم اختبار الكود باستخدام Python 3.6 وKeras 2.2.4
لقد قدمنا نصوصًا برمجية لإنشاء مجموعات بيانات Reddit ومعالجة Switchboard بالإضافة إلى مجموعة بيانات الألعاب في هذا الريبو لتصحيح الأخطاء.
يرجى التحقق هنا لمزيد من التفاصيل.
لتدريب نموذج SpaceFusion: python src/main.py mtask train --data_name=toy
لتصور المساحة الكامنة المستفادة: python src/vis.py --data_name=toy
للتفاعل مع النموذج المُدرب: python src/main.py mtask interact --data_name=toy --method=?
حيث يمكن أن تكون الطريقة greedy
أو rand
أو sampling
أو beam
. استخدمنا rand
في الورقة
لإنشاء فرضيات للاختبار باستخدام النموذج المُدرب: python src/main.py mtask test --data_name=toy
لتقييم الفرضيات المولدة python src/eval.py --path_hyp=? --path_ref=? --wt_len=?
، والذي يقوم بإخراج الدقة والاستدعاء وF1 كما هو محدد في الورقة. قد ترغب أولاً في تشغيل هذا الأمر باستخدام -len_only
للعثور على wt_len
المناسب الذي يقلل الفرق بين متوسط الطول (عدد الرموز) للفرضية والمرجع.
main.py
هو الملف الرئيسي
يحدد model.py
نموذج SpaceFusion (راجع class MTask
) وبعض الخطوط الأساسية
يحدد vis.py
الوظيفة التي استخدمناها لتصور وتحليل المساحة الكامنة
يحدد dataset.py
وحدة تغذية البيانات
يحدد shared.py
المعلمات التشعبية الافتراضية
يرجى الاستشهاد بورقة NAACL الخاصة بنا إذا كان هذا الريبو قد ألهم عملك :)
@article{gao2019spacefusion, title={Jointly Optimizing Diversity and Relevance in Neural Response Generation}, author={Gao, Xiang and Lee, Sungjin and Zhang, Yizhe and Brockett, Chris and Galley, Michel and Gao, Jianfeng and Dolan, Bill}, journal={NAACL-HLT 2019}, year={2019} }