이 페이지는 논문에 제시된 데이터 세트를 참조합니다.
새로운 것은 MarkIT입니다: 표시된 건축물의 이탈리아 트리뱅크입니다. Teresa Paccosi, Alessio Palmero Aprosio 및 Sara Tonelli, 2022년 제8차 이탈리아 컴퓨터 언어학 컨퍼런스 회의록에 출연 예정(CLIC-it 2021)
MarkIT 리소스에는 구문 종속성을 수동으로 주석 처리한 학생들의 에세이에서 추출한 약 800개의 문장이 포함되어 있습니다. 나무둑에는 7가지 유형의 표시된 구성과 구문이 표시된 것으로 잘못 분류될 수 있는 일부 모호한 문장이 포함되어 있습니다.
MarkIT는 종속성 주석이 포함된 약 800개의 문장을 포함하는 이탈리아어로 표시된 구성의 트리뱅크입니다. 먼저 Tint를 사용하여 문장에 자동으로 주석을 추가한 다음 전체 데이터 세트에서 오류를 수동으로 수정합니다. 이 리소스는 표시된 구성의 7가지 유형과 구문이 표시된 것으로 잘못 분류될 수 있는 일부 모호한 문장을 다루고 있습니다.
데이터 세트의 선택, 추출 및 주석은 Teresa Paccosi, Alessio Palmero Aprosio 및 Sara Tonelli가 수행했습니다.
=== 기계 판독 가능 메타데이터(삭제하지 마세요!) ================================= 사용 가능한 데이터: UD vX.X 라이센스: CC BY 4.0 텍스트 포함: 예 장르: 학습자 에세이 Lemmas: 자동 수정 UPOS: 수정 후 자동 XPOS: 자동 수정 기능: 자동 수정 관계: 수동 네이티브 기여자: Paccosi, Teresa; 팔메로 아프로시오, 알레시오; 토넬리, 사라 기여: 다른 곳 연락처: [email protected] ================================================= =============================