이 프로젝트의 목적은 데이터 분석 기술을 활용하여 특정 크리켓 토너먼트, 특히 ICC Cricket World Cup 2022에 대한 최고의 플레이 11을 결정하는 것이었습니다. 이 프로젝트에는 ESPN Cricinfo 웹 사이트의 데이터를 웹 스크래핑하고 Python 및 Pandas를 사용하여 데이터를 변환하는 작업이 포함되었습니다. , 통찰력 있는 시각적 표현을 위해 Power BI를 사용하여 대화형 대시보드를 만듭니다.
ESPN Cricinfo의 웹 스크래핑 데이터:
타사 웹 스크레이퍼인 "Bright Data"를 활용하여 ESPN Cricinfo 웹사이트에서 경기 데이터, 결과, 선수 타격 데이터, 볼링 데이터 등의 정보를 효과적으로 수집했습니다.
스크랩된 데이터는 추가 처리를 위해 JSON 형식으로 저장되었습니다.
데이터 변환 및 변환:
Python과 Pandas를 활용하여 JSON 데이터를 CSV 형식으로 변환했습니다.
데이터가 Power BI에서 직접 사용하기에 적합한 형식인지 확인하여 테이블 조인 프로세스를 단순화했습니다.
Power BI 대시보드 생성:
Power BI의 파워 쿼리를 활용하여 분석용 데이터를 추가로 변환하고 정리했습니다.
파워히터, 중위 타자, 볼러 등 다양한 측면에 대한 측정값을 제시하는 대화형 차트와 시각화 기능을 갖춘 동적 대시보드를 만들었습니다.
이러한 대시보드는 플레이어 성과, 팀 강점, 개선 영역에 대한 귀중한 통찰력을 제공했습니다.
최고의 연주 형성 11:
대시보드에서 얻은 요구 사항과 통찰력을 기반으로 최고의 플레이 11을 구성하기 위해 데이터 중심 분석 및 의사 결정 기술을 적용했습니다.
결합된 플레이 11은 팀 성과를 최적화하고 2022년 ICC 크리켓 월드컵에서 성공 가능성을 높이기 위해 결정되었습니다.
사용된 기술:
웹 스크래핑: Bright Data(타사 웹 스크래퍼)
프로그래밍 언어: Python
데이터 조작: 팬더
데이터 시각화: Power BI
결과:
프로젝트의 역동적이고 유익한 대시보드는 크리켓 팀 경영진, 코치 및 열성팬이 2022년 ICC 크리켓 월드컵을 위한 최고의 플레이 11을 전략화하고 선택할 수 있도록 실행 가능한 통찰력을 제공했습니다.