تحليل التبعية
بيانات
تشغيل البرنامج: تدريب النموذج وتقييمه
تصفح التبعيات
ملحق: أجزاء من شرح الكلام
الملحق: التحليل النحوي (شجرة بناء الجملة)
الملحق: تمثيل العلاقة
وصف التنسيق: تنسيق CoNLL-U
في هذا البرنامج، يلزم وجود أول 10 أعمدة من البيانات بهذا التنسيق على الأقل:
قائمة | اسم | معنى |
---|---|---|
1 | بطاقة تعريف | معرف الكلمة يبدأ من 1 |
2 | استمارة | كلمة |
3 | ليما | الجذر الإنجليزي، المعنى الصيني |
4 | UPOSTAG | أجزاء الكلام (مجموعة أجزاء الكلام الملخصة عبر اللغات) |
5 | XPOSTAG | أجزاء الكلام غير العالمية (خاصة باللغة) |
6 | المفاخر | الخصائص المورفولوجية |
7 | رأس | العقدة الأصلية التي تنتمي إليها هذه الكلمة |
8 | ديبريل | العلاقة بالعقدة الأم |
9 | DEPS | العقدة الثانوية المرتبطة |
10 | متفرقات | معلومات تكميلية أخرى |
في كل عمود من الأعمدة المذكورة أعلاه، تعني القيمة "_" أنه غير متاح.
في هذا البرنامج، يُسمح للأعمدة 3 و5 و6 و9 و10 بأن تحتوي على "_"، ويجب أن تكون الأعمدة الأخرى قيمًا صالحة.
https://github.com/UniversalDependeency/UD_Chinese-GSD
https://github.com/UniversalDependeency/UD_English-EWT
مجموعات التدريب ومجموعات التطوير المقدمة من جامعة تسينغهوا ومعهد هاربين للتكنولوجيا
تحقق من مجموعات البيانات الأخرى.
مقدمة تفصيلية: تحليل التبعية
عند تحديث شجرة التبعية للجملة على وجه التحديد، هناك فكرتان: قياسية (من الأسفل إلى الأعلى) وحريصة (من الأعلى إلى الأسفل).
التبعيات: py2.7
pip install -r requirements.txt
admin/standard.thu.train.sh # 训练中文模型
admin/standard.thu.test.sh # 测试中文模型
admin/standard.ewt.train.sh # 训练英文模型
admin/standard.ewt.test.sh # 测试英文模型
admin/eager.thu.train.sh # 训练中文模型
admin/eager.thu.test.sh # 测试中文模型
admin/eager.ewt.train.sh # 训练英文模型
admin/eager.ewt.test.sh # 测试英文模型
نتائج UD_Chinese-GSD :
I0316 23:19:25.249176 140736085984064 eager.py:152] accuracy: 0.760666326704
I0316 23:19:25.249367 140736085984064 eager.py:153] complete: 0.206
I0316 23:19:25.389566 140736085984064 eager.py:156] recall: 0.745088245088
I0316 23:19:25.391751 140736085984064 eager.py:158] precision: 0.760666326704
I0316 23:19:25.391916 140736085984064 eager.py:159] assigned: 0.97952047952
استخدم conllu.js لتصفح التبعيات: افتح صفحة الويب، وانقر فوق الزر "تحرير"، ثم الصق محتوى تنسيق CoNLL-U في المحرر. على سبيل المثال، قم بلصق المحتوى التالي في صفحة الويب conllu.js.
1 就 _ RB RB _ 7 mark _ SpaceAfter=No
2 像 _ IN IN _ 6 case _ SpaceAfter=No
3 所有 _ DT DT _ 6 det _ SpaceAfter=No
4 的 _ DEC DEC _ 3 case:dec _ SpaceAfter=No
5 大 _ PFA PFA _ 6 case:pref _ SpaceAfter=No
6 賣場 _ NN NN _ 7 nmod _ SpaceAfter=No
7 一樣 _ JJ JJ _ 15 acl _ SpaceAfter=No
8 , _ , , _ 15 punct _ SpaceAfter=No
9 宜家 _ NNP NNP _ 10 nmod _ SpaceAfter=No
10 家居 _ NN NN _ 11 nsubj _ SpaceAfter=No
11 吸引 _ VV VV _ 14 acl:relcl _ SpaceAfter=No
12 的 _ DEC DEC _ 11 mark:relcl _ SpaceAfter=No
13 消費 _ VV VV _ 14 case:suff _ SpaceAfter=No
14 者 _ SFN SFN _ 15 nsubj _ SpaceAfter=No
15 來 _ VV VV _ 0 root _ SpaceAfter=No
16 自 _ VV VV _ 15 mark _ SpaceAfter=No
17 於 _ VV VV _ 15 mark _ SpaceAfter=No
18 範圍 _ NN NN _ 20 nsubj _ SpaceAfter=No
19 非常 _ RB RB _ 20 advmod _ SpaceAfter=No
20 廣大 _ JJ JJ _ 22 acl:relcl _ SpaceAfter=No
21 的 _ DEC DEC _ 20 mark:relcl _ SpaceAfter=No
22 地區 _ NN NN _ 15 obj _ SpaceAfter=No
23 . _ . . _ 15 punct _ SpaceAfter=No
ملاحظة: قم بتضمين السطر الفارغ أسفل السطر 17 عند اللصق لأن الأسطر الفارغة تعمل كعلامات بين الجمل.
يتم الحصول على شجرة التبعية التالية:
app/standard.py و app/eager.py عبارة عن أكواد تدريب، والتنفيذ الأساسي لمحلل النقل موجود في app/transitionparser.py .
التبعيات: ArcEagerConfiguration --> ArcEagerParser، ArcStandardConfiguration --> ArcStandardParser2
شفرة:
شفرة:
مقدمة في التحليل النحوي
مهمة CoNLL-2009 المشتركة: التبعيات النحوية والدلالية في لغات متعددة
محللو التبعية على أساس الانتقال
conllu.js
python︱جرب ست وحدات لتجزئة الكلمات الصينية: jieba، THULAC، SnowNLP، pynlpir، CoreNLP، pyLTP
[1] ليانغ هوانغ، وينبين جيانغ وكون ليو 2009. الإعراب المقيد ثنائي اللغة (أحادي اللغة).
CC: conjunction, coordinatin 表示连词
CD: numeral, cardinal 表示基数词
DT: determiner 表示限定词
EX: existential there 存在句
FW: foreign word 外来词
IN: preposition or conjunction, subordinating 介词或从属连词
JJ: adjective or numeral, ordinal 形容词或序数词
JJR: adjective, comparative 形容词比较级
JJS: adjective, superlative 形容词最高级
LS: list item marker 列表标识
MD: modal auxiliary 情态助动词
NN: noun, common, singular or mass
NNS: noun, common, plural
NNP: noun, proper, singular
NNPS: noun, proper, plural
PDT: pre-determiner 前位限定词
POS: genitive marker 所有格标记
PRP: pronoun, personal 人称代词
PRP:pronoun,possessive所有格代词RB:adverb副词RBR:adverb,comparative副词比较级RBS:adverb,superlative副词最高级RP:particle小品词SYM:symbol符号TO:”to”asprepositionorinfinitivemarker作为介词或不定式标记UH:interjection插入语VB:verb,baseformVBD:verb,pasttenseVBG:verb,presentparticipleorgerundVBN:verb,pastparticipleVBP:verb,presenttense,not3rdpersonsingularVBZ:verb,presenttense,3rdpersonsingularWDT:WH−determinerWH限定词WP:WH−pronounWH代词WP: WH-pronoun, possessive WH所有格代词
WRB:Wh-adverb WH副词
معيار وضع علامات جزء من الكلام الصيني: مجموعة علامات جزء من الكلام ICTPOS3.0
ROOT:要处理文本的语句
IP:简单从句
NP:名词短语
VP:动词短语
PU:断句符,通常是句号、问号、感叹号等标点符号
LCP:方位词短语
PP:介词短语
CP:由‘的’构成的表示修饰性关系的短语
DNP:由‘的’构成的表示所属关系的短语
ADVP:副词短语
ADJP:形容词短语
DP:限定词短语
QP:量词短语
NN:常用名词
NR:固有名词:表示仅适用于该项事物的名词,含地名,人名,国名,书名,团体名称以及一事件的名称等。
NT:时间名词
PN:代词
VV:动词
VC:是
CC:表示连词
VE:有
VA:表语形容词
AS:内容标记(如:了)
VRD:动补复合词
CD: 表示基数词
DT: determiner 表示限定词
EX: existential there 存在句
FW: foreign word 外来词
IN: preposition or conjunction, subordinating 介词或从属连词
JJ: adjective or numeral, ordinal 形容词或序数词
JJR: adjective, comparative 形容词比较级
JJS: adjective, superlative 形容词最高级
LS: list item marker 列表标识
MD: modal auxiliary 情态助动词
PDT: pre-determiner 前位限定词
POS: genitive marker 所有格标记
PRP: pronoun, personal 人称代词
RB: adverb 副词
RBR: adverb, comparative 副词比较级
RBS: adverb, superlative 副词最高级
RP: particle 小品词
SYM: symbol 符号
TO:”to” as preposition or infinitive marker 作为介词或不定式标记
WDT: WH-determiner WH限定词
WP: WH-pronoun WH代词
WP$: WH-pronoun, possessive WH所有格代词
WRB:Wh-adverb WH副词
abbrev: abbreviation modifier,缩写
acomp: adjectival complement,形容词的补充;
advcl : adverbial clause modifier,状语从句修饰词
advmod: adverbial modifier状语
agent: agent,代理,一般有by的时候会出现这个
amod: adjectival modifier形容词
appos: appositional modifier,同位词
attr: attributive,属性
aux: auxiliary,非主要动词和助词,如BE,HAVE SHOULD/COULD等到
auxpass: passive auxiliary 被动词
cc: coordination,并列关系,一般取第一个词
ccomp: clausal complement从句补充
complm: complementizer,引导从句的词好重聚中的主要动词
conj : conjunct,连接两个并列的词。
cop: copula。系动词(如be,seem,appear等),(命题主词与谓词间的)连系
csubj : clausal subject,从主关系
csubjpass: clausal passive subject 主从被动关系
dep: dependent依赖关系
det: determiner决定词,如冠词等
dobj : direct object直接宾语
expl: expletive,主要是抓取there
infmod: infinitival modifier,动词不定式
iobj : indirect object,非直接宾语,也就是所以的间接宾语;
mark: marker,主要出现在有“that” or “whether”“because”, “when”,
mwe: multi-word expression,多个词的表示
neg: negation modifier否定词
nn: noun compound modifier名词组合形式
npadvmod: noun phrase as adverbial modifier名词作状语
nsubj : nominal subject,名词主语
nsubjpass: passive nominal subject,被动的名词主语
num: numeric modifier,数值修饰
number: element of compound number,组合数字
parataxis: parataxis: parataxis,并列关系
partmod: participial modifier动词形式的修饰
pcomp: prepositional complement,介词补充
pobj : object of a preposition,介词的宾语
poss: possession modifier,所有形式,所有格,所属
possessive: possessive modifier,这个表示所有者和那个’S的关系
preconj : preconjunct,常常是出现在 “either”, “both”, “neither”的情况下
predet: predeterminer,前缀决定,常常是表示所有
prep: prepositional modifier
prepc: prepositional clausal modifier
prt: phrasal verb particle,动词短语
punct: punctuation,这个很少见,但是保留下来了,结果当中不会出现这个
purpcl : purpose clause modifier,目的从句
quantmod: quantifier phrase modifier,数量短语
rcmod: relative clause modifier相关关系
ref : referent,指示物,指代
rel : relative
root: root,最重要的词,从它开始,根节点
tmod: temporal modifier
xcomp: open clausal complement
xsubj : controlling subject 掌控者
https://bot.chatopera.com/
خدمة Chatopera السحابية هي خدمة سحابية متكاملة لتنفيذ روبوتات الدردشة، ويتم إصدار الفاتورة لها بناءً على عدد مكالمات الواجهة. تعد خدمة Chatopera Cloud Service بمثابة مثيل برنامج كخدمة لمنصة Chatopera bot. استنادًا إلى الحوسبة السحابية، تعد خدمة Chatopera السحابية عبارة عن خدمة سحابية لروبوتات الدردشة كخدمة .
تشتمل منصة روبوت Chatopera على مكونات مثل قاعدة المعرفة، والحوار متعدد الجولات، والتعرف على النوايا والتعرف على الكلام، وتطوير روبوت الدردشة الموحد، وتدعم سيناريوهات مثل الأسئلة والأجوبة الذكية ذات الوصول المفتوح للمؤسسات، والأسئلة والأجوبة الذكية للموارد البشرية، وخدمة العملاء الذكية والتسويق عبر الإنترنت. تستخدم أقسام تكنولوجيا المعلومات في المؤسسات وإدارات الأعمال خدمات Chatopera السحابية لجلب روبوتات الدردشة عبر الإنترنت بسرعة!
قاموس مخصص
شروط مخصصة
خلق النية
إضافة الحجج والفتحات
نموذج التدريب
محادثة اختبارية
صورة روبوت
تكامل النظام
تاريخ الدردشة
استخدم الآن