Cricket Data Analytics Project Using Web Scraping Python Pandas and Power BI
1.0.0
該計畫的目的是利用數據分析技術來確定特定板球錦標賽(特別是2022 年國際板球聯合會板球世界盃)的最佳11 名球員。和Pandas 轉換數據,並使用 Power BI 創建互動式儀表板以實現富有洞察力的視覺表示。
從 ESPN Cricinfo 抓取資料:
利用第三方網路抓取工具“Bright Data”,有效地從ESPN Cricinfo網站收集信息,包括比賽數據、比賽結果、球員擊球數據和保齡球數據。
抓取到的資料以JSON的形式儲存以供進一步處理。
資料轉換與轉換:
利用 Python 和 Pandas 將 JSON 資料轉換為 CSV 格式。
確保資料採用適當的格式直接在 Power BI 中使用,簡化了連接表的過程。
Power BI 儀表板建立:
利用Power BI中的Power Query進一步轉換和清理資料以進行分析。
建立具有互動式圖表和視覺化的動態儀表板,呈現各個方面的測量值,例如強力擊球手、中級擊球手和投球手。
這些儀表板提供了球員表現、團隊優勢和改進領域的寶貴見解。
組成最佳11人:
應用數據驅動的分析和決策技術,根據從儀表板獲得的要求和見解形成最佳的 11 人比賽。
11 人組合參賽的目的是為了優化球隊表現並增加 2022 年國際板球世界盃的成功機會。
使用的技術:
網頁抓取:Bright Data(第三方網頁抓取)
程式語言:Python
資料處理:Pandas
資料視覺化:Power BI
結果:
該計畫的動態和資訊豐富的儀表板為板球隊管理層、教練和愛好者提供了可行的見解,以製定策略並選擇 2022 年 ICC 板球世界盃的最佳 11 名球員。