หน้านี้อ้างถึงชุดข้อมูลที่นำเสนอในรายงาน:
เป็น MarkIT ที่เป็นของใหม่: Treebank ของอิตาลีที่มีเครื่องหมายการก่อสร้าง Teresa Paccosi, Alessio Palmero Aprosio และ Sara Tonelli ปรากฏตัวในการประชุมภาษาอิตาลีครั้งที่ 8 เรื่องภาษาศาสตร์คอมพิวเตอร์ปี 2022 (CLIC-it 2021)
แหล่งข้อมูล MarkIT มีประโยคประมาณ 800 ประโยคที่ดึงมาจากเรียงความของนักเรียนที่มีคำอธิบายประกอบด้วยตนเองพร้อมการพึ่งพาวากยสัมพันธ์ ฝั่งต้นไม้ครอบคลุมการก่อสร้างที่ทำเครื่องหมายไว้เจ็ดประเภท รวมถึงประโยคที่คลุมเครือบางประโยคซึ่งสามารถจำแนกไวยากรณ์ผิดว่าเป็นเครื่องหมายได้
MarkIT เป็นธนาคารต้นไม้ที่รวบรวมโครงสร้างที่ทำเครื่องหมายไว้ในภาษาอิตาลี ประกอบด้วยประโยคประมาณ 800 ประโยคพร้อมคำอธิบายประกอบแบบพึ่งพา ขั้นแรก เราจะใส่คำอธิบายประกอบประโยคโดยอัตโนมัติโดยใช้ Tint จากนั้นจึงทำการแก้ไขข้อผิดพลาดด้วยตนเองกับชุดข้อมูลทั้งหมด แหล่งข้อมูลครอบคลุมโครงสร้างที่ทำเครื่องหมายไว้เจ็ดประเภท รวมถึงประโยคที่ไม่ชัดเจนบางประโยค ซึ่งสามารถจำแนกไวยากรณ์ผิดว่าเป็นเครื่องหมายได้
การเลือก การแตกข้อมูล และการเพิ่มความคิดเห็นของชุดข้อมูลดำเนินการโดย Teresa Paccosi, Alessio Palmero Aprosio และ Sara Tonelli
=== ข้อมูลเมตาที่เครื่องอ่านได้ (อย่าลบ!) ================================ ข้อมูลมีตั้งแต่: UD vX.X ใบอนุญาต: CC BY 4.0 รวมถึงข้อความ: ใช่ ประเภท: ผู้เรียน-เรียงความ บทแทรก: อัตโนมัติพร้อมการแก้ไข UPOS: อัตโนมัติพร้อมการแก้ไข XPOS: อัตโนมัติพร้อมการแก้ไข คุณสมบัติ: อัตโนมัติพร้อมการแก้ไข ความสัมพันธ์: คู่มือเจ้าของภาษา ผู้ร่วมให้ข้อมูล: ปาคโคซี, เทเรซา; พัลเมโร อาโปซิโอ, อเลสซิโอ; โทเนลลี, ซารา การมีส่วนร่วม: ที่อื่น ติดต่อ: [email protected] -