此頁面引用了論文中提供的資料集:
這是新的 MarkIT:義大利標記結構樹庫。 Teresa Paccosi、Alessio Palmero Aprosio 和 Sara Tonelli,將出現在 2022 年第八屆義大利計算語言學會議論文集 (CLIC-it 2021)
MarkIT 資源包含從學生論文中提取的大約 800 個句子,並帶有句法依賴性手動註釋。這個樹庫涵蓋了七種類型的標記結構,以及一些語法可能被錯誤歸類為標記的歧義句子。
MarkIT 是義大利語標記結構樹庫,包含大約 800 個有依存註釋的句子。首先,我們使用 Tint 自動註解句子,然後對整個資料集執行錯誤的手動修復。此資源涵蓋了七種類型的標記結構以及一些歧義句子,其語法可能被錯誤地歸類為標記結構。
資料集的選擇、提取和註釋由 Teresa Paccosi、Alessio Palmero Aprosio 和 Sara Tonelli 完成。
=== 機器可讀的元資料(請勿刪除!)==================================== 資料自以下日期起可使用:UD vX.X 授權:CC BY 4.0 包含文字:是 類型: 學習者論文 引理:自動修正 UPOS:自動修正 XPOS:自動修正 特色:自動修正 關係:手動原生 貢獻者:帕科西、特雷莎;帕爾梅羅·阿普羅西奧、阿萊西奧;薩拉·託內利 貢獻:其他地方 聯絡方式: [email protected] ==================================================== = ===============================