كان الهدف من هذا المشروع هو الاستفادة من تقنيات تحليل البيانات لتحديد أفضل 11 لاعبًا في بطولة كريكيت معينة، وتحديدًا كأس العالم للكريكيت 2022. وتضمن المشروع استخراج البيانات من الويب من موقع ESPN Cricinfo، وتحويل البيانات باستخدام Python وPandas. وإنشاء لوحات معلومات تفاعلية باستخدام Power BI للتمثيل المرئي الثاقب.
استخراج بيانات الويب من ESPN Cricinfo:
تم استخدام أداة استخراج البيانات "Bright Data" التابعة لجهة خارجية لجمع المعلومات بشكل فعال من موقع ESPN Cricinfo، بما في ذلك بيانات المباراة والنتائج وبيانات ضرب اللاعبين وبيانات البولينج.
تم تخزين البيانات المسروقة في شكل JSON لمزيد من المعالجة.
تحويل البيانات وتحويلها:
الاستفادة من Python وPandas لتحويل بيانات JSON إلى تنسيق CSV.
التأكد من أن البيانات كانت بتنسيق مناسب لاستخدامها مباشرة في Power BI، مما يبسط عملية ربط الجداول.
إنشاء لوحة تحكم Power BI:
تم استخدام Power Query في Power BI لمزيد من تحويل البيانات وتنظيفها للتحليل.
تم إنشاء لوحات معلومات ديناميكية تحتوي على مخططات ومرئيات تفاعلية، وتقدم مقاييس لجوانب مختلفة، مثل ضاربي القوة، ورجال المضرب من الدرجة المتوسطة، ولاعبي البولينج.
قدمت لوحات المعلومات هذه رؤى قيمة حول أداء اللاعب ونقاط قوة الفريق ومجالات التحسين.
تشكيل أفضل لعب 11:
تم تطبيق التحليل المبني على البيانات وتقنيات اتخاذ القرار لتشكيل أفضل لعب 11 بناءً على المتطلبات والأفكار التي تم الحصول عليها من لوحة المعلومات.
تم تصميم اللعب المشترك 11 على تحسين أداء الفريق وزيادة فرص النجاح في كأس العالم للكريكيت 2022.
التقنيات المستخدمة:
تجريف الويب: البيانات الساطعة (مكشطة الويب التابعة لجهة خارجية)
لغة البرمجة: بايثون
معالجة البيانات: الباندا
تصور البيانات: Power BI
النتائج:
قدمت لوحات المعلومات الديناميكية والمفيدة للمشروع رؤى قابلة للتنفيذ لإدارة فريق الكريكيت والمدربين والمتحمسين لوضع إستراتيجيات واختيار أفضل 11 لاعبًا لكأس العالم للكريكيت 2022 في ICC.