โพสต์ข้อมูลการติดตามสำหรับเหยือกเบสบอล
readme.md - ภาพรวมสั้น ๆ ของข้อมูลและวิธีการใช้งาน
example_script.r - สคริปต์ที่มีตัวอย่างของวิธีการใช้ข้อมูล
ข้อมูลสามารถดูได้ที่ลิงค์ Dropbox ต่อไปนี้: https://www.dropbox.com/sh/gxxxnqu9c1v0d6w/aaa8ilsel7yb3_uyn03_k7vba?dl=0
ไฟล์หลักคือ pitcher_motion_data.csv นี่คือไฟล์ CSV ประมาณ 500 MB
นอกจากนี้ยังมีไฟล์ CSV Companion ซึ่งมีข้อมูล Statcast ที่สอดคล้องกับสนามที่รวมอยู่ในชุดข้อมูลนี้
ข้อมูลถูกนำไปใช้สำหรับประเภทเหยือก/พิทช์ซึ่งถูกโยนอย่างน้อย 5 ครั้งที่ Tropicana Field ในฤดูกาลปกติ 2021 5 ตัวอย่างวิดีโอถูกใช้สำหรับแต่ละสนามในแต่ละกรณีเหล่านี้เป็นเหยือกครั้งสุดท้ายที่โยนโดยเหยือกโดยเฉพาะ
ใช้สนาม Tropicana เพราะมีมุมกล้อง Centerfield ซึ่งใช้งานง่าย มีข้อมูลที่ จำกัด เท่านั้นเนื่องจากปริมาณการคำนวณที่จำเป็นในการวัดตำแหน่งเหยือก
แต่ละสนามสามารถระบุได้โดยใช้สามคอลัมน์:
คอลัมน์ "normalised_frame" มีตัวแปรเวลาสำหรับสนามวัดในเฟรมวิดีโอ (วิดีโอคือ 60fps) นี่คือศูนย์ที่ยกขาของเหยือกและขยายทั้งในทิศทางบวกและลบ
การตรวจจับเหยือกนั้นดำเนินการโดยอัตโนมัติตามตำแหน่งของพวกเขาในเฟรมการซิงโครไนซ์ของสนามจะดำเนินการโดยอัตโนมัติโดยใช้การยกขาของเหยือก อาจมีกรณีที่กระบวนการนี้ล้มเหลวเนื่องจากอัลกอริทึมการติดตามท่าไม่ได้ระบุเหยือกหรือบางส่วนของการเคลื่อนไหวของเหยือกไม่เห็นในวิดีโอไฮไลต์ ฉันรวมธงความน่าเชื่อถือสองตัวเพื่อแสดงเมื่อกระบวนการนี้ล้มเหลว
"no_missing_frames" = 1 เมื่อเหยือกสามารถสังเกตได้อย่างต่อเนื่องจาก normalised_frame = -20 ถึง +120 มิฉะนั้นอาจมีเฟรมในช่วงเวลานี้ที่ไม่ตรวจพบเหยือกและหายไปจากชุดข้อมูล "smooth_com_flag" = 1 เมื่อตำแหน่งลำตัวของเหยือกไม่แตกต่างกันไปมากกว่า 100 พิกเซลระหว่างเฟรมติดต่อกันสิ่งนี้จะลบกรณีที่ผู้เล่นที่แตกต่างกันอาจถูกตรวจพบเป็นเหยือก การกรองโดยคอลัมน์ทั้งสองนี้ให้ข้อมูลการเคลื่อนไหวที่แข็งแกร่งที่สุด
คอลัมน์ V1 ถึง V51 อธิบายตำแหน่งของชิ้นส่วนร่างกายของเหยือกในพิกเซล แต่ละส่วนของร่างกายถูกอธิบายโดยสามคอลัมน์พิกัดแนวนอนและแนวตั้งเป็นสองคนแรกฉันไม่แน่ใจว่าสิ่งที่สามคืออะไร แต่ฉันทิ้งไว้ในชุดข้อมูล คำสั่งจะถูกทิ้งไว้เสมอก่อนจากนั้นขวาเลื่อนลงไปตามร่างกาย
V1-V15 เป็นคะแนนบนหัว
V16-V21 เป็นไหล่
V22-V27 เป็นข้อศอก
V28-V33 เป็นมือ
V34-V39 เป็นสะโพก
V40-V45 เป็นหัวเข่า
V46-V51 เป็นเท้า
ส่วนประกอบแนวตั้งคือจำนวนพิกเซลจาก ด้านบน ของภาพดังนั้นคุณต้องใช้ (720 - ตัวแปร) ของสิ่งเหล่านี้เพื่อให้ได้ตำแหน่งที่ถูกต้องบนภาพ
นอกจากนี้ยังมีตัวแปรอื่น ๆ ที่เหลือจากการระบุเหยือกและตัวแปรที่มีความพยายามพื้นฐานในการวัดการแยกสะโพก/ไหล่จากข้อมูล 2D นี้นี่ไม่ใช่การวัดที่เชื่อถือได้!
ต้องขอบคุณ BaseballSavant และ MLB สำหรับการสร้างไฮไลท์วิดีโอที่สามารถใช้งานได้ทางออนไลน์ซึ่งเป็นสิ่งจำเป็นในการรวบรวมข้อมูลในระดับนี้
นอกจากนี้ยังต้องขอบคุณ Will McNally สำหรับ Kapao การตรวจจับท่าทางทั้งหมดทำได้โดยใช้อัลกอริทึมนี้ซึ่งนำไปใช้ใน Python
https://github.com/wmcnally/kapao
นี่คือชุดข้อมูลประเภทหนึ่งที่ไม่เคยมีมาก่อนฉันหวังว่าจะพบการใช้งานบางอย่าง
หากคุณมีคำแนะนำใด ๆ ติดต่อบน Twitter @pitching_bot หรือค้นหาข้อมูลติดต่อของฉันที่เว็บไซต์ของฉัน
Cameron Grove - 24/12/21