ดาวน์โหลด COLDataset - ดาวน์โหลดซอร์สโค้ด COLDataset

COLDataset

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

Coldataset

ที่เก็บอย่างเป็นทางการของกระดาษ: เย็น: มาตรฐานสำหรับการตรวจจับภาษาที่น่ารังเกียจของจีน

中文冒犯语言检测数据集

ลิงค์กระดาษ: https://arxiv.org/abs/2201.06025

Detector: เราเปิดตัวเวอร์ชันของ Roberta-Base-Cold ใน HuggingFace

ข่าว

บทความของเราได้รับการยอมรับจาก EMNLP 2022!

ข้อมูล

Coldataset มีความคิดเห็น 37,480 ความคิดเห็นพร้อมป้ายกำกับที่น่ารังเกียจแบบไบนารีและครอบคลุมหัวข้อที่หลากหลายของเชื้อชาติเพศและภูมิภาค เพื่อให้ได้ข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับประเภทข้อมูลและลักษณะเราใส่คำอธิบายประกอบการทดสอบในระดับที่ดีด้วยสี่หมวดหมู่: โจมตีบุคคลการโจมตีกลุ่มต่อต้านอคติและอื่น ๆ ที่ไม่น่ารังเกียจ

ฉลากใน Train.csv และ dev.csv:

ฉลาก 0: ปลอดภัย
ฉลาก 1: รุก

ฉลากที่ละเอียดในการทดสอบ CSV:

0: ปลอดภัย (อื่น ๆ ไม่ได้ปิด)
1: โจมตีแต่ละคน
2: กลุ่มโจมตี
3: ปลอดภัย (ต่อต้านอคติ)

การอ้าง

โปรดกรุณาอ้างอิงกระดาษของเราหากบทความนี้และชุดข้อมูลมีประโยชน์

  @article{deng2022cold,
  title="Cold: A benchmark for chinese offensive language detection",
  author= "Deng, Jiawen and Zhou, Jingyan and Sun, Hao and Mi, Fei and Huang, Minlie",
  booktitle = "Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing",
  month = dec,
  year = "2022",
  address = "Abu Dhabi, United Arab Emirates",
  publisher = "Association for Computational Linguistics",
  url = "https://aclanthology.org/2022.emnlp-main.796",
  pages = "11580--11599"
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-08
ขนาด 2.63MB
มาจาก Github

แอปที่เกี่ยวข้อง

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
SmartTube

2024-12-14
chat.petals.dev

2024-11-30
viptools for eslam

2024-12-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
MySchedule.py

ซอร์สโค้ดอื่น ๆ

Updates to the fetching of week codes
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด