ARIA-การระบุจุดสังเกต
โปรเจ็กต์นี้จัดเก็บสคริปต์สำหรับการประเมินแนวทางในการระบุ ARIA-Landmarks ในเว็บแอปพลิเคชันโดยอัตโนมัติ วิธีการนี้อิงตามการจัดหมวดหมู่และการจัดกลุ่มองค์ประกอบ DOM เพื่อระบุองค์ประกอบที่มีความน่าจะเป็นสูงสุดที่จะเป็นจุดสังเกตของ ARIA
โปรเจ็กต์นี้ถูกนำไปใช้ใน Python และนำเสนอ Dockerfile สำหรับสร้างอิมเมจ Docker ที่สามารถเรียกใช้สคริปต์ได้
ไฟล์หลักของโครงการ (main.py) ดำเนินกิจกรรมหลายอย่างเพื่อดำเนินการระบุ ARIA-Landmarks กิจกรรมและทรัพยากรอินพุต/เอาท์พุตจะอธิบายต่อไป:
- การฝึกอบรมตัวแยกประเภท (pipeline.cross_validation.fit_classifier) : ฝึกตัวแยกประเภท (SVM, KNN, DT หรือ RF) โดยใช้ชุดข้อมูลการฝึกอบรม (./data/training.classified.csv) และบันทึกไฟล์แยกประเภทและตัวแยกประเภทที่สร้างขึ้นใน ;/results /โฟลเดอร์ลักษณนาม สคริปต์ยังเรียกใช้ CV 10 เท่าเพื่อสร้างรายงานความแม่นยำสำหรับตัวแยกประเภท
- รวมรายงาน CV (pipeline.merge_cv_reports.merge_reports) : รวมรายงานความถูกต้องของ CV ที่สร้างขึ้นในกิจกรรมก่อนหน้าเป็นสเปรดชีตเดียวสำหรับการวิเคราะห์ (./results/accuracy.xlsx) ไฟล์นี้มีรายงานความแม่นยำโดยพิจารณา F1-Score/Precision และการเรียกคืนสำหรับแต่ละคลาส มาโครเฉลี่ย และค่าเฉลี่ยถ่วงน้ำหนัก สเปรดชีตยังนำเสนอความถี่ที่คุณลักษณะแต่ละอย่างของแบบจำลองการจำแนกประเภทถูกนำมาใช้ในการเขียนคู่แยก/ตัวแยกประเภท
- จำแนกชุดข้อมูลการทดสอบ (pipeline.classify_test_dataset) : ใช้ตัวแยก/ตัวแยกประเภท RF ที่ติดตั้งไว้ (./results/classifier) เพื่อจำแนกตัวอย่างที่มีอยู่ในชุดข้อมูลการทดสอบ (./data/test/) ชุดข้อมูลทดสอบประกอบด้วยข้อมูลที่ดึงมาจากองค์ประกอบของเว็บแอปพลิเคชันต่างๆ ผลลัพธ์ของกิจกรรมนี้จะถูกจัดเก็บไว้ในโฟลเดอร์ ./resutls/test
- การคาดการณ์ชุดข้อมูลการทดสอบการจัดกลุ่ม (pipeline.clustering_rows.cluster_rows) : จัดกลุ่มผลลัพธ์ของการจำแนกชุดข้อมูลทดสอบตามคุณสมบัติคลาสและตำแหน่ง/ขนาด สำหรับแต่ละคลัสเตอร์ จะมีการรายงานเฉพาะองค์ประกอบที่มีความน่าจะเป็นสูงสุดที่จะเป็นจุดสังเกต ARIA ผลลัพธ์ของกิจกรรมนี้จะถูกเก็บไว้ในโฟลเดอร์ ./results/clusters
- การสร้างรายงานรูปภาพ (pipeline.image_report.generate_reports) : สร้างรายงานรูปภาพสำหรับจุดสังเกต ARIA ที่ระบุในกิจกรรมก่อนหน้า (./results/clusters โฟลเดอร์) และภาพหน้าจอของแอปพลิเคชันเว็บที่เกี่ยวข้อง (./data/screenshots โฟลเดอร์) รายงานรูปภาพจะถูกสร้างขึ้นสำหรับจุดสังเกต ARIA แต่ละรายการที่ระบุในกิจกรรมก่อนหน้านี้ และจัดเก็บไว้ในโฟลเดอร์ ./results/image-reports