อัปเดต: ข้อมูลการฝึกอบรมและการทดสอบที่มีป้ายกำกับพร้อมใช้งานแล้ว! กรุณาลงทะเบียนร่วมงานได้ที่ https://easychair.org/conferences/?conf=affcon2020
คลังข้อมูลและคำอธิบายประกอบสำหรับงานที่ใช้ร่วมกันของ CL-Aff - รับ #OffMyChest - จาก Nanyang Technological University Singapore
ส่วนหนึ่งของ AffCon Workshop @ AAAI 2019 สำหรับการสร้างแบบจำลองผลกระทบต่อการตอบสนอง
มีความสนใจเพิ่มมากขึ้นในการทำความเข้าใจว่ามนุษย์เริ่มต้นและสนทนาอย่างไร ความเข้าใจในบทสนทนาอย่างมีอารมณ์มุ่งเน้นไปที่ปัญหาวิธีที่ผู้พูดใช้อารมณ์เพื่อตอบสนองต่อสถานการณ์และต่อกันและกัน เราแนะนำชุดข้อมูลการสนทนา OffMyChest และเชิญชวนให้ส่งงานที่ใช้ร่วมกันด้านภาษาศาสตร์คอมพิวเตอร์ส่งผลต่อความเข้าใจ (CL-Aff) ในการสร้างแบบจำลองการตอบสนองทางอารมณ์เชิงโต้ตอบ
อัปเดตระบบดำเนินการกำหนดเวลาส่งผลงาน: 18 ธันวาคม 2019
ชุดข้อมูลของเรามีให้บริการภายใต้ใบอนุญาต CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/)
ระบุ : ประโยคตัวอย่างจากการสนทนาทั่วไปและสารภาพในหมู่บรรณาธิการใน /r/CasualConversations และชุมชน /r/OffMyChest ซึ่งมีป้ายกำกับสำหรับการเปิดเผยและลักษณะการสนับสนุน
ภารกิจที่ 1 : งานการเรียนรู้แบบกึ่งกำกับดูแล: ทำนายป้ายกำกับสำหรับการเปิดเผยข้อมูลและการสนับสนุนประโยคโดยพิจารณาจากข้อมูลการฝึกอบรมแบบมีป้ายกำกับขนาดเล็กและขนาดใหญ่ที่ไม่มีป้ายกำกับ
ภารกิจที่ 2 : งานที่ไม่มีผู้ดูแล: เสนอคุณลักษณะใหม่และข้อมูลเชิงลึกเพื่อสร้างแบบจำลองไดนามิกของการสนทนา
ชุดฝึกที่ไม่มีป้ายกำกับ :
โพสต์ที่ไม่มีป้ายกำกับ: โพสต์ยอดนิยมในปี 2018 ใน /r/CasualConversations และ /r/OffMyChest ที่กล่าวถึงคำสำคัญใดๆ โพสต์ที่เป็นผู้ปกครองของความคิดเห็นในชุดการฝึกอบรมและการทดสอบจะถูกระบุแยกกัน
ความคิดเห็นที่ไม่มีป้ายกำกับ: ประโยคมากกว่า 420,000 ประโยคที่แยกจากความคิดเห็น 130,000 รายการโพสต์ไปที่ "โพสต์"
ชุดฝึกที่มีป้ายกำกับ : ประโยคที่มีป้ายกำกับ 12,860 ประโยค ดึงมาจากความคิดเห็นยอดนิยมที่โพสต์ใน "POSTS"
ชุดทดสอบ: ประโยคที่ไม่มีป้ายกำกับ 5,000 ประโยค ดึงมาจากความคิดเห็นยอดนิยมที่โพสต์ใน "POSTS"
ตรวจสอบคำแนะนำคำอธิบายประกอบภายใต้ /docs/
การเปิดเผยข้อมูล ยังแบ่งประเภทเพิ่มเติมเป็นการเปิดเผยข้อมูลและอารมณ์
การสนับสนุน ยังแบ่งได้เป็นการสนับสนุนทั่วไป การสนับสนุนทางข้อมูล และทางอารมณ์
นี่คือพื้นที่เก็บข้อมูลแบบเปิดสำหรับความเข้าใจที่ส่งผลต่อความเข้าใจในข้อความและคำอธิบายประกอบที่เผยแพร่สู่สาธารณะผ่านความร่วมมือระหว่างมหาวิทยาลัยเทคโนโลยีนันยาง มหาวิทยาลัยเพนซิลวาเนีย และ Adobe Research India ประกอบด้วยความคิดเห็น (บางส่วนมีป้ายกำกับ) และโพสต์หลัก (ทั้งหมดไม่มีป้ายกำกับ) จากชุมชน /r/CasualConversations และ /r/OffMyChest
./README.md
ไฟล์นี้.
./FAQ2020
ที่จะเพิ่มจะมีคำถามที่พบบ่อยรวมถึงการอัปเดตคลังข้อมูล
./docs/labeldescriptions.txt
คำจำกัดความสำหรับแต่ละป้ายกำกับ
./scripts/*
สคริปต์ Python ที่ใช้ในการรวบรวมข้อมูล
wife, girlfriend, gf, husband, boyfriend, bf
คำค้นหาที่ใช้ในการรวบรวมข้อมูลจาก API
./docs/corpusconstruction.txt
หากต้องการเพิ่ม readme ที่ให้รายละเอียดเกี่ยวกับกฎและขั้นตอนต่างๆ ในการสร้างคลังเอกสาร
./docs/annotation_*.txt
กฎปฏิบัติตามสำหรับคำอธิบายประกอบ
./data/unlabeled data
ไดเร็กทอรีที่มีข้อมูลที่ไม่มีป้ายกำกับซึ่งเกี่ยวข้องกับชุดการฝึกอบรมและชุดทดสอบ
./data/training data
ไดเร็กทอรีที่มีชุดการฝึกอบรม
./data/test data
ไดเร็กทอรีที่มีชุดทดสอบ
ควรส่งผลลัพธ์ของระบบจากชุดการทดสอบไปยังผู้จัดงาน เพื่อการเปรียบเทียบผลลัพธ์สุดท้ายที่จะนำเสนอในเวิร์กช็อป
หากคุณมีคำถามใดๆ เกี่ยวกับขอบเขตของเวิร์คช็อปหรือต้องการข้อมูลเพิ่มเติม โปรดอย่าลังเลที่จะส่งอีเมล:
นิยาติ, chhaya [AT] Adobe.com
Kokil, jaidka [AT] sas.upenn.edu
เจียฮุ่ย jhlu [AT] ntu.edu.sg
กรุณา "ดู" พื้นที่เก็บข้อมูลนี้! เราอาจเผยแพร่การอัปเดตเพิ่มเติมในสัปดาห์ต่อๆ ไป หลังจากงานที่ใช้ร่วมกัน เรายังวางแผนที่จะเพิ่มคุณค่าให้กับข้อมูลนี้ด้วยคำอธิบายประกอบ คุณสมบัติเมตา และตัวแยกประเภทที่ได้รับการฝึกอบรมเพิ่มเติม เพื่อช่วยในการใช้งานดาวน์สตรีม
หากคุณใช้ข้อมูลและเผยแพร่ โปรดแจ้งให้เราทราบและอ้างอิงเอกสารภาพรวมของ CL-Aff ของเรา:
@inproceedings{jaidka2020claff,
ที่อยู่ = {นิวยอร์ก สหรัฐอเมริกา}
ผู้แต่ง = { Jaidka, Kokil และ Singh, Iknoor และ Lu, Jiahui และ Chhaya, Niyati และ Ungar, Lyle},
booktitle = {การดำเนินการของการประชุมเชิงปฏิบัติการ AAAI-20 เรื่องการวิเคราะห์เนื้อหาเชิงอารมณ์},
ผู้จัดพิมพ์ = {AAAI},
title = {{รายงานของงานที่ใช้ร่วมกันของ CL-Aff OffMyChest: การสร้างแบบจำลองการสนับสนุนและการเปิดเผย}},
ปี = {2020}
-
เราขอขอบคุณ Pushshift API และ Jason Baumgartner สำหรับโค้ดที่ทำให้งานนี้เป็นไปได้ ขอบคุณ!
Kokil Jaidka มหาวิทยาลัยเทคโนโลยีนันยาง
Niyati Chhaya, Big Data Experience Lab, ฝ่ายวิจัยของ Adobe
Jiahui Lu มหาวิทยาลัยเทคโนโลยีนันยาง
อิคนัวร์ ซิงห์ มหาวิทยาลัยปัญจาบ
Lyle Ungar มหาวิทยาลัยเพนซิลวาเนีย
ตรวจสอบเว็บไซต์ Workshop และ Shared Task: https://sites.google.com/view/affcon2020/home