ARIA-تحديد المعالم
يقوم هذا المشروع بتخزين البرامج النصية لتقييم طريقة التعرف تلقائيًا على معالم ARIA في تطبيقات الويب. يعتمد هذا النهج على تصنيف عناصر DOM وتجميعها لتحديد العناصر ذات الاحتمالية الأعلى لتكون معالم ARIA.
تم تنفيذ المشروع في بايثون ويقدم ملف Dockerfile لإنشاء صورة Docker قادرة على تشغيل البرامج النصية.
ينفذ الملف الرئيسي للمشروع (main.py) أنشطة متعددة لإجراء تحديد ARIA-Landmarks. يتم وصف الأنشطة وموارد المدخلات / المخرجات الخاصة بها فيما يلي:
- تدريب المصنف (pipeline.cross_validation.fit_classifier) : تدريب المصنف (SVM أو KNN أو DT أو RF) باستخدام مجموعة بيانات التدريب (./data/training.classified.csv) وحفظ ملفات المستخرج والمصنف المخلل التي تم إنشاؤها في؛/النتائج /مجلد المصنف. تقوم البرامج النصية أيضًا بتشغيل 10 أضعاف السيرة الذاتية لإنشاء تقارير دقة للمصنف.
- دمج تقارير السيرة الذاتية (pipeline.merge_cv_reports.merge_reports) : دمج تقارير دقة السيرة الذاتية التي تم إنشاؤها في النشاط السابق في جدول بيانات واحد للتحليل (./results/accuracy.xlsx). يحتوي هذا الملف على تقارير دقة تراعي F1-Score/Precision وRecall لكل فئة، ومتوسط قيم الماكرو والمتوسط المرجح. يعرض جدول البيانات أيضًا تكرار استخدام كل ميزة من نماذج التصنيف لتكوين زوج المستخرج/المصنف.
- تصنيف مجموعة بيانات الاختبار (pipeline.classify_test_dataset) : يستخدم مستخرج/مصنف التردد اللاسلكي المجهز (./results/classifier) لتصنيف العينات المتوفرة في مجموعة بيانات الاختبار (./data/test/). تتكون مجموعة بيانات الاختبار من بيانات مستخرجة من عناصر تطبيقات الويب المختلفة. يتم تخزين نتائج هذا النشاط في المجلد ./resutls/test.
- تجميع تنبؤات مجموعة بيانات الاختبار (pipeline.clustering_rows.cluster_rows) : تجميع نتائج تصنيف مجموعة بيانات الاختبار وفقًا لتسمية فئتها وميزات الموضع/الحجم. بالنسبة لكل مجموعة، يتم الإبلاغ فقط عن العنصر الذي يتمتع بأعلى احتمالية ليكون أحد معالم ARIA. يتم تخزين نتائج هذا النشاط في المجلد ./results/clusters.
- إنشاء تقارير صور (pipeline.image_report.generate_reports) : لإنشاء تقارير صور لمعالم ARIA المحددة في النشاط السابق (مجلد ./results/clusters) ولقطات شاشة لتطبيقات الويب المعنية (مجلد ./data/screenshots). يتم إنشاء تقارير الصور لكل معلم ARIA تم تحديده في الأنشطة السابقة ويتم تخزينها في المجلد ./results/image-reports.