หยาง ซู, จงฮอน จอง, ลาธา เพมูลา, ตงชิง จาง, ออนการ์ ดาเบียร์
พื้นที่เก็บข้อมูลนี้ประกอบด้วยทรัพยากรสำหรับรายงาน ECCV-2022 ของเราเรื่อง "การฝึกล่วงหน้าแบบควบคุมตัวเองด้วย SPot-the-Difference สำหรับการตรวจจับความผิดปกติและการแบ่งส่วน" ขณะนี้เราเผยแพร่ชุดข้อมูล Visual Anomaly (VisA)
ชุดข้อมูล VisA ประกอบด้วย 12 ชุดย่อยที่สอดคล้องกับออบเจ็กต์ที่แตกต่างกัน 12 รายการดังแสดงในรูปด้านบน มีรูปภาพ 10,821 รูป โดยมีตัวอย่างปกติ 9,621 รายการ และตัวอย่างผิดปกติ 1,200 รายการ เซ็ตย่อยสี่เซ็ตคือแผงวงจรพิมพ์ (PCB) ประเภทต่างๆ ที่มีโครงสร้างค่อนข้างซับซ้อนซึ่งประกอบด้วยทรานซิสเตอร์ ตัวเก็บประจุ ชิป ฯลฯ สำหรับกรณีที่มีหลายอินสแตนซ์ในมุมมอง เราจะรวบรวมเซ็ตย่อยสี่เซ็ต: แคปซูล เทียน มักกะโรนี1 และมักกะโรนี2 อินสแตนซ์ใน Capsules และ Macaroni2 แตกต่างกันอย่างมากในตำแหน่งและท่าทาง ยิ่งไปกว่านั้น เรายังรวบรวมชุดย่อยสี่ชุด ได้แก่ เม็ดมะม่วงหิมพานต์ หมากฝรั่ง Fryum และ Piperyum ซึ่งวัตถุจะถูกจัดเรียงอย่างคร่าว ๆ รูปภาพที่ผิดปกติประกอบด้วยข้อบกพร่องต่างๆ รวมถึงข้อบกพร่องบนพื้นผิว เช่น รอยขีดข่วน รอยบุบ จุดสีหรือรอยแตก และข้อบกพร่องด้านโครงสร้าง เช่น การผิดที่หรือชิ้นส่วนที่หายไป
วัตถุ | #ตัวอย่างปกติ | #ตัวอย่างความผิดปกติ | #คลาสผิดปกติ | ประเภทวัตถุ |
---|---|---|---|---|
PCB1 | 1,004 | 100 | 4 | โครงสร้างที่ซับซ้อน |
PCB2 | 1,001 | 100 | 4 | โครงสร้างที่ซับซ้อน |
PCB3 | 1,006 | 100 | 4 | โครงสร้างที่ซับซ้อน |
PCB4 | 1,005 | 100 | 7 | โครงสร้างที่ซับซ้อน |
แคปซูล | 602 | 100 | 5 | หลายกรณี |
เทียน | 1,000 | 100 | 8 | หลายกรณี |
มักกะโรนี1 | 1,000 | 100 | 7 | หลายกรณี |
มักกะโรนี2 | 1,000 | 100 | 7 | หลายกรณี |
เม็ดมะม่วงหิมพานต์ | 500 | 100 | 9 | อินสแตนซ์เดียว |
หมากฝรั่ง | 503 | 100 | 6 | อินสแตนซ์เดียว |
ฟรายัม | 500 | 100 | 8 | อินสแตนซ์เดียว |
ท่อทอด | 500 | 100 | 9 | อินสแตนซ์เดียว |
เราโฮสต์ชุดข้อมูล VisaA ใน AWS S3 และคุณสามารถดาวน์โหลดได้โดยใช้ URL นี้
แผนผังข้อมูลของข้อมูลที่ดาวน์โหลดมีดังนี้
VisA
| -- candle
| ----- | --- Data
| ----- | ----- | ----- Images
| ----- | ----- | -------- | ------ Anomaly
| ----- | ----- | -------- | ------ Normal
| ----- | ----- | ----- Masks
| ----- | ----- | -------- | ------ Anomaly
| ----- | --- image_anno.csv
| -- capsules
| ----- | ----- ...
image_annot.csv ให้ป้ายกำกับระดับรูปภาพและมาสก์คำอธิบายประกอบระดับพิกเซลสำหรับแต่ละรูปภาพ ฟังก์ชันแผนที่ id2class สำหรับมาสก์หลายคลาสสามารถพบได้ใน ./utils/id2class.py ที่นี่มาสก์สำหรับรูปภาพปกติจะไม่ถูกจัดเก็บเพื่อประหยัดพื้นที่
เพื่อเตรียมการตั้งค่า 1 คลาส 2 คลาส highshot 2 คลาสไม่กี่ช็อตที่อธิบายไว้ในรายงานต้นฉบับ เราใช้ ./utils/prepare_data.py เพื่อจัดระเบียบข้อมูลใหม่ตามไฟล์แยกข้อมูลใน "./split_csv/" . เราให้ตัวอย่างบรรทัดคำสั่งสำหรับการเตรียมการตั้งค่า 1 คลาสดังนี้
python ./utils/prepare_data.py --split-type 1cls --data-folder ./VisA --save-folder ./VisA_pytorch --split-file ./split_csv/1cls.csv
แผนผังข้อมูลของการตั้งค่าคลาส 1 ที่จัดระเบียบใหม่มีดังนี้
VisA_pytorch
| -- 1cls
| ----- | --- candle
| ----- | ----- | ----- ground_truth
| ----- | ----- | ----- test
| ----- | ----- | ------- | ------- good
| ----- | ----- | ------- | ------- bad
| ----- | ----- | ----- train
| ----- | ----- | ------- | ------- good
| ----- | --- capsules
| ----- | --- ...
โดยเฉพาะอย่างยิ่ง ข้อมูลที่จัดระเบียบใหม่สำหรับการตั้งค่า 1 คลาสจะเป็นไปตามแผนผังข้อมูลของ MVTec-AD สำหรับแต่ละออบเจ็กต์ ข้อมูลจะมีสามโฟลเดอร์:
โปรดทราบว่ามาสก์การแบ่งส่วนความจริงภาคพื้นดินหลายคลาสในชุดข้อมูลดั้งเดิมจะได้รับการจัดทำดัชนีใหม่เป็นมาสก์ไบนารี โดยที่ 0 หมายถึงภาวะปกติ และ 255 หมายถึงความผิดปกติ
นอกจากนี้ การตั้งค่า 2 คลาสสามารถจัดเตรียมได้ในลักษณะเดียวกันโดยการเปลี่ยนอาร์กิวเมนต์ของ wait_data.py
หากต้องการคำนวณเมตริกการแบ่งประเภทและการแบ่งส่วน โปรดดูที่ ./utils/metrics.py โปรดทราบว่าเราจะนำตัวอย่างปกติมาพิจารณาเมื่อคำนวณเมตริกการแปลเป็นภาษาท้องถิ่น สิ่งนี้แตกต่างจากงานอื่นๆ บางงานที่ไม่คำนึงถึงตัวอย่างปกติในการแปลเป็นภาษาท้องถิ่น
โปรดอ้างอิงเอกสารต่อไปนี้หากชุดข้อมูลนี้ช่วยเหลือโครงการของคุณ:
@article { zou2022spot ,
title = { SPot-the-Difference Self-Supervised Pre-training for Anomaly Detection and Segmentation } ,
author = { Zou, Yang and Jeong, Jongheon and Pemula, Latha and Zhang, Dongqing and Dabeer, Onkar } ,
journal = { arXiv preprint arXiv:2207.14315 } ,
year = { 2022 }
}
ข้อมูลเผยแพร่ภายใต้ใบอนุญาต CC BY 4.0