此页面引用了论文中提供的数据集:
这是新的 MarkIT:意大利标记结构树库。 Teresa Paccosi、Alessio Palmero Aprosio 和 Sara Tonelli,将出现在 2022 年第八届意大利计算语言学会议论文集 (CLIC-it 2021)
MarkIT 资源包含从学生论文中提取的大约 800 个句子,并带有句法依赖性手动注释。该树库涵盖七种类型的标记结构,以及一些语法可能被错误归类为标记的歧义句子。
MarkIT 是意大利语标记结构树库,包含大约 800 个带依存注释的句子。首先,我们使用 Tint 自动注释句子,然后对整个数据集执行错误的手动修复。该资源涵盖了七种类型的标记结构以及一些歧义句子,其语法可能被错误地归类为标记结构。
数据集的选择、提取和注释由 Teresa Paccosi、Alessio Palmero Aprosio 和 Sara Tonelli 完成。
=== 机器可读的元数据(请勿删除!)================================== 数据自:UD vX.X 起可用 许可证:CC BY 4.0 包含文字:是 类型: 学习者论文 引理:自动修正 UPOS:自动修正 XPOS:自动修正 特点:自动修正 关系:手动原生 贡献者:帕科西、特雷莎;帕尔梅罗·阿普罗西奥、阿莱西奥;萨拉·托内利 贡献:其他地方 联系方式: [email protected] =================================================== =============================