姿勢跟踪棒球投手的數據
readme.md-數據的簡短概述以及如何使用
example_script.r-一個帶有如何使用數據的示例的腳本
數據可以在以下Dropbox鏈接中找到:https://www.dropbox.com/sh/gxxxxnqu9c1v0d6w/aaa8ilsel7yb3_uyn03_k7vba?dl = 0
主文件是pitcher_motion_data.csv。這是約500 MB的CSV文件。
還有一個配套CSV文件,其中包含與該數據集中包含的音調相對應的Statcast數據。
數據是針對2021年常規賽在Tropicana Field至少投入5次的投手/音高類型的數據。每個音高都使用5個示例視頻,在每種情況下,這些都是特定投手的最後一個。
之所以使用Tropicana字段,是因為它具有易於使用的中央攝像頭角度。僅包括有限的數據,由於測量投手位置所需的計算量。
每個單獨的音高都可以通過使用三列來唯一識別:
列“ normalistion_frame”包含在視頻幀中測量的音調的時間變量(視頻為60fps)。這是在投手的腿升上電梯上的零,並在正方向和負方向上延伸。
投手的檢測是根據其在框架中的位置自動完成的,通過使用投手的腿升力自動執行音高的同步。在某些情況下,此過程失敗了,因為姿勢跟踪算法沒有識別投手,或者投手運動的某些部分在精彩視頻中沒有看到。我包括兩個可靠性標誌以顯示此過程失敗的時間。
“ NO_MISSING_FRAMES” = 1當可以連續觀察到投手從normolistion_frame = -20到+120時,否則在此時間段內可能會有幀未檢測到投手,因此從數據集中丟失了投手。 “ Smooth_com_flag” = 1當投手的軀幹位置在連續幀之間不超過100像素時,這會刪除可以檢測到不同玩家作為投手的情況。這兩個列的過濾提供了最強大的運動數據集。
V1至V51列描述了投手身體部位的位置。每個身體部位都由三列描述,水平和垂直坐標是前兩個,我不確定第三個是什麼,但我將其留在數據集中。訂單始終先留下然後向右留下,沿著身體向下移動
V1-V15是頭上的點
V16-V21是肩膀
V22-V27是肘部
V28-V33是手
V34-V39是臀部
V40-V45是膝蓋
V46-V51是腳
垂直組件是圖像頂部的像素數量,因此您需要採取這些像素(720-變量)才能在圖像上獲得正確的位置。
也有其他一些變量,這些變量還從投手識別中留下來,還有一個包含與此2D數據的臀部/肩部分離的基本嘗試的變量,這不是可靠的測量!
感謝棒球運動和美國職業棒球大聯盟(MLB)使視頻亮點易於在線提供,這對於在此規模上收集數據至關重要。
同樣感謝Will McNally的Kapao,所有姿勢檢測都是使用Python實施的該算法進行的。
https://github.com/wmcnally/kapao
這是一種以前尚未公開可用的數據集,我希望可以找到一些使用。
如果您有任何建議在Twitter @pitching_bot上取得聯繫,或在我的網站上找到我的聯繫信息
卡梅倫·格羅夫(Cameron Grove)-24/12/21