Diese Seite bezieht sich auf den im Artikel vorgestellten Datensatz:
Neu ist MarkIT: Eine italienische Baumdatenbank markierter Konstruktionen. Teresa Paccosi, Alessio Palmero Aprosio und Sara Tonelli, erscheinen in Proceedings of the Eighth Italian Conference on Computational Linguistics 2022 (CLIC-it 2021)
Die MarkIT-Ressource enthält rund 800 Sätze, die aus Aufsätzen von Studenten extrahiert und manuell mit syntaktischen Abhängigkeiten versehen wurden. Die Baumbank umfasst sieben Arten markierter Konstruktionen sowie einige mehrdeutige Sätze, deren Syntax fälschlicherweise als markiert klassifiziert werden kann.
MarkIT ist eine Baumdatenbank markierter Konstruktionen in italienischer Sprache, die etwa 800 Sätze mit Abhängigkeitsanmerkungen enthält. Zuerst kommentieren wir die Sätze automatisch mit Tint, dann wird eine manuelle Korrektur der Fehler für den gesamten Datensatz durchgeführt. Die Ressource umfasst sieben Arten markierter Konstruktionen sowie einige mehrdeutige Sätze, deren Syntax fälschlicherweise als markiert klassifiziert werden kann.
Die Auswahl, Extraktion und Annotation des Datensatzes wurde von Teresa Paccosi, Alessio Palmero Aprosio und Sara Tonelli durchgeführt.
=== Maschinenlesbare Metadaten (NICHT ENTFERNEN!) =============================== Daten verfügbar seit: UD vX.X Lizenz: CC BY 4.0 Enthält Text: ja Genre: Lernaufsätze Lemmata: automatisch mit Korrekturen UPOS: automatisch mit Korrekturen XPOS: automatisch mit Korrekturen Merkmale: automatisch mit Korrekturen Beziehungen: manuell nativ Mitwirkende: Paccosi, Teresa; Palmero Aprosio, Alessio; Tonelli, Sara Beitrag: anderswo Kontakt: [email protected] =============================================== =============================