يانغ زو، جونغهيون جيونغ، لاثا بيمولا، دونغتشينغ تشانغ، أونكار دبير.
يحتوي هذا المستودع على الموارد الخاصة بورقة ECCV-2022 الخاصة بنا "التدريب المسبق الخاضع للإشراف الذاتي على SPot-the-Difference للكشف عن الحالات الشاذة وتقسيمها". نقوم حاليًا بإصدار مجموعة بيانات الشذوذ البصري (VisA).
تحتوي مجموعة بيانات VisA على 12 مجموعة فرعية تقابل 12 كائنًا مختلفًا كما هو موضح في الشكل أعلاه. هناك 10821 صورة مع 9621 عينة عادية و1200 عينة شاذة. أربع مجموعات فرعية هي أنواع مختلفة من لوحات الدوائر المطبوعة (PCB) ذات هياكل معقدة نسبيًا تحتوي على ترانزستورات ومكثفات ورقائق وما إلى ذلك. بالنسبة لحالة المثيلات المتعددة في طريقة العرض، فإننا نجمع أربع مجموعات فرعية: الكبسولات والشموع والمعكرونة 1 والمعكرونة 2. تختلف المثيلات الموجودة في الكبسولات والمعكرونة 2 إلى حد كبير في المواقع والأوضاع. علاوة على ذلك، قمنا بجمع أربع مجموعات فرعية بما في ذلك الكاجو، والعلكة، والفريم، والغليون، حيث تتم محاذاة الكائنات بشكل تقريبي. تحتوي الصور الشاذة على عيوب مختلفة، بما في ذلك العيوب السطحية مثل الخدوش أو الخدوش أو البقع الملونة أو الشقوق، والعيوب الهيكلية مثل سوء وضع الأجزاء أو فقدانها.
هدف | #عينات عادية | #عينات شاذة | # فئات الشذوذ | نوع الكائن |
---|---|---|---|---|
ثنائي الفينيل متعدد الكلور1 | 1,004 | 100 | 4 | هيكل معقد |
ثنائي الفينيل متعدد الكلور2 | 1,001 | 100 | 4 | هيكل معقد |
ثنائي الفينيل متعدد الكلور3 | 1,006 | 100 | 4 | هيكل معقد |
ثنائي الفينيل متعدد الكلور4 | 1,005 | 100 | 7 | هيكل معقد |
كبسولات | 602 | 100 | 5 | حالات متعددة |
الشموع | 1000 | 100 | 8 | حالات متعددة |
المعكرونة1 | 1000 | 100 | 7 | حالات متعددة |
المعكرونة2 | 1000 | 100 | 7 | حالات متعددة |
الكاجو | 500 | 100 | 9 | مثيل واحد |
مضغ العلكة | 503 | 100 | 6 | مثيل واحد |
فريوم | 500 | 100 | 8 | مثيل واحد |
فروم الأنابيب | 500 | 100 | 9 | مثيل واحد |
نحن نستضيف مجموعة بيانات VisaA في AWS S3 ويمكنك تنزيلها عبر عنوان URL هذا.
شجرة البيانات للبيانات التي تم تنزيلها هي كما يلي.
VisA
| -- candle
| ----- | --- Data
| ----- | ----- | ----- Images
| ----- | ----- | -------- | ------ Anomaly
| ----- | ----- | -------- | ------ Normal
| ----- | ----- | ----- Masks
| ----- | ----- | -------- | ------ Anomaly
| ----- | --- image_anno.csv
| -- capsules
| ----- | ----- ...
يوفر image_annot.csv تسمية على مستوى الصورة وقناع تعليق توضيحي على مستوى البكسل لكل صورة. يمكن العثور على وظائف خريطة id2class للأقنعة متعددة الفئات في ./utils/id2class.py هنا لا يتم تخزين أقنعة الصور العادية لتوفير المساحة.
لإعداد إعدادات 1-class، 2-class-highshot، 2-class-fewshot الموصوفة في الورقة الأصلية، نستخدم ./utils/prepare_data.py لإعادة تنظيم البيانات بعد ملفات تقسيم البيانات في "./split_csv/" . نقدم نموذجًا لسطر الأوامر لإعداد الإعداد من فئة واحدة على النحو التالي.
python ./utils/prepare_data.py --split-type 1cls --data-folder ./VisA --save-folder ./VisA_pytorch --split-file ./split_csv/1cls.csv
شجرة البيانات الخاصة بإعداد الفئة الأولى المُعاد تنظيمها هي كما يلي.
VisA_pytorch
| -- 1cls
| ----- | --- candle
| ----- | ----- | ----- ground_truth
| ----- | ----- | ----- test
| ----- | ----- | ------- | ------- good
| ----- | ----- | ------- | ------- bad
| ----- | ----- | ----- train
| ----- | ----- | ------- | ------- good
| ----- | --- capsules
| ----- | --- ...
على وجه التحديد، تتبع البيانات المعاد تنظيمها لإعداد فئة واحدة شجرة بيانات MVTec-AD. لكل كائن، تحتوي البيانات على ثلاثة مجلدات:
لاحظ أنه تمت إعادة فهرسة أقنعة تجزئة الحقيقة الأرضية متعددة الفئات في مجموعة البيانات الأصلية إلى أقنعة ثنائية حيث يشير 0 إلى الحالة الطبيعية ويشير 255 إلى الشذوذ.
بالإضافة إلى ذلك، يمكن إعداد إعدادات الفئتين بطريقة مماثلة عن طريق تغيير وسيطات إعداد_بيانات.py.
لحساب مقاييس التصنيف والتجزئة، يرجى الرجوع إلى ./utils/metrics.py. لاحظ أننا نأخذ العينات العادية في الاعتبار عند حساب مقاييس الترجمة. وهذا يختلف عن بعض الأعمال الأخرى بغض النظر عن العينات الطبيعية في التوطين.
يرجى الاستشهاد بالمقالة التالية إذا كانت مجموعة البيانات هذه تساعد مشروعك:
@article { zou2022spot ,
title = { SPot-the-Difference Self-Supervised Pre-training for Anomaly Detection and Segmentation } ,
author = { Zou, Yang and Jeong, Jongheon and Pemula, Latha and Zhang, Dongqing and Dabeer, Onkar } ,
journal = { arXiv preprint arXiv:2207.14315 } ,
year = { 2022 }
}
يتم إصدار البيانات بموجب ترخيص CC BY 4.0.