QBQTC
1.0.0
QBQTC: مجموعة عنوان استعلام متصفح QQ
مجموعة بيانات صلة البحث في متصفح QQ
QQ Browser Query Title Corpus (QBQTC، QQ Browser Query Title Corpus) عبارة عن تعليق توضيحي تعليمي تم إنشاؤه حاليًا بواسطة محرك بحث QQ Browser لسيناريوهات البحث الكبيرة التي تدمج الملاءمة والسلطة وجودة المحتوى والتوقيت ومجموعة بيانات التعليقات التوضيحية للأبعاد الأخرى (LTR). يستخدم على نطاق واسع في سيناريوهات الأعمال محرك البحث.
معنى الارتباط: 0، ارتباط ضعيف 1، ارتباط معين 2، وثيق الصلة بالموضوع. كلما زاد العدد كلما زادت العلاقة.
مجموعة التدريب (القطار) | مجموعة التحقق من الصحة (تطوير) | مجموعة الاختبار العامة (test_public) | مجموعة الاختبارات الخاصة (الاختبار) |
---|---|---|---|
180,000 | 20.000 | 5000 | >=10,0000 |
نموذج | مجموعة التدريب (القطار) | مجموعة التحقق من الصحة (تطوير) | مجموعة الاختبار العامة (test_public) | معلمات التدريب |
---|---|---|---|---|
قاعدة بيرت | F1:80.3 أك:84.3 | F1: 64.9 اكس: 72.4 | F1: 64.1 اكس: 71.8 | الدفعة=64، الطول=52، العصر=7، lr=2e-5، الإحماء=0.9 |
روبرتا-wwm-ext | F1:67.9 أك:76.2 | F1:64.9 أك:71.5 | F1:64.0 أكس:71.0 | الدفعة=64، الطول=52، العصر=7، lr=2e-5، الإحماء=0.9 |
روبرتا-wwm-كبيرة-ext | F1:79.8 أك:84.2 | F1:65.1 أك:72.4 | F1:66.3 أك:73.1 | الدفعة=64، الطول=52، العصر=7، lr=2e-5، الإحماء=0.9 |
تأتي f1_score من sklearn.metrics، وتكون صيغة الحساب كما يلي: F1 = 2 * (precision * recall) / (precision + recall)
使用方式:
1、克隆项目
git clone https://github.com/CLUEbenchmark/QBQTC.git
2、进入到相应的目录
例如:cd QBQTC/baselines
3、下载对应任务模型参数
QBQTC/weights/bert-base-chinese
QBQTC/weights/chinese-roberta-wwm-ext
QBQTC/weights/chinese-roberta-wwm-ext-large
4、运行对应任务的模型(GPU方式):
python BERT.py --model_name_or_path ../weights/chinese-roberta-wwm-ext --max_seq_length 52 --batch_size 64 --num_epochs 7 --learning_rate 2e-5 --num_labels 3
简化版:python BERT.py
{"id": 0, "query": "小孩咳嗽感冒", "title": "小孩感冒过后久咳嗽该吃什么药育儿问答宝宝树", "label": "1"}
{"id": 1, "query": "前列腺癌根治术后能活多久", "title": "前列腺癌转移能活多久前列腺癌治疗方法盘点-家庭医生在线肿瘤频道", "label": "1"}
{"id": 3, "query": "如何将一个文件复制到另一个文件里", "title": "怎么把布局里的图纸复制到另外一个文件中去百度文库", "label": "0"}
{"id": 214, "query": "免费观看电影速度与激情1", "title": "《速度与激情1》全集-高清电影完整版-在线观看", "label": "2"}
{"id": 98, "query": "昆明公积金", "title": "昆明异地购房不能用住房公积金中新网", "label": "2"}
{"id": 217, "query": "多张图片怎么排版好看", "title": "怎么排版图片", "label": "2"}
إرسال العينة
عمل تنبؤات اختبارية على مجموعة الاختبار (test.json) وتقديمها إلى نظام التقييم