Pose melacak data untuk pitcher baseball
README.MD - Tinjauan singkat dari data dan cara menggunakannya
Example_script.r - skrip dengan contoh cara menggunakan data
Data dapat ditemukan di tautan dropbox berikut: https://www.dropbox.com/sh/gxxxnqu9c1v0d6w/aaa8ilsel7yb3_yyn03_k7vba?dl=0
File utama adalah pitcher_motion_data.csv. Ini adalah file CSV sekitar 500 MB.
Ada juga file CSV pendamping yang berisi data statcast yang sesuai dengan pitch yang termasuk dalam dataset ini.
Data diambil untuk pitcher/jenis pitch yang telah dilemparkan setidaknya 5 kali di Tropicana Field pada musim reguler 2021. 5 Video sampel digunakan untuk setiap pitch, dalam setiap kasus ini adalah yang terakhir dilemparkan oleh pitcher tertentu.
Lapangan Tropicana digunakan karena memiliki sudut kamera tengah yang mudah dikerjakan. Hanya data terbatas yang disertakan karena volume perhitungan yang diperlukan untuk mengukur posisi pitcher.
Setiap pitch individu dapat diidentifikasi secara unik dengan menggunakan tiga kolom:
Kolom "Normised_frame" berisi variabel waktu untuk pitch, diukur dalam bingkai video (video 60fps). Ini dimusnahkan pada pengangkatan kaki pitcher dan meluas ke arah positif dan negatif.
Deteksi pitcher dilakukan secara otomatis berdasarkan posisi mereka dalam bingkai, sinkronisasi pitch dilakukan secara otomatis dengan menggunakan pengangkatan kaki pitcher. Mungkin ada kasus di mana proses ini gagal karena algoritma pelacakan pose tidak mengidentifikasi pitcher, atau bagian dari gerakan pitcher tidak terlihat dalam video highlight. Saya menyertakan dua bendera keandalan untuk ditunjukkan ketika proses ini gagal.
"NO_MISSING_FRAMES" = 1 Ketika pitcher dapat diamati secara terus -menerus dari normalised_frame = -20 hingga +120, jika tidak mungkin ada bingkai dalam periode waktu ini di mana pitcher tidak terdeteksi dan karenanya hilang dari dataset. "smooth_com_flag" = 1 Ketika posisi batang pitcher tidak bervariasi lebih dari 100 piksel antara bingkai berturut -turut, ini menghilangkan kasus di mana pemain yang berbeda dapat dideteksi sebagai pitcher. Penyaringan oleh kedua kolom ini memberikan set data gerakan yang paling kuat.
Kolom V1 ke V51 menjelaskan posisi bagian tubuh pitcher dalam piksel. Setiap bagian tubuh dijelaskan oleh tiga kolom, koordinat horizontal dan vertikal adalah dua yang pertama, saya tidak yakin apa yang ketiga tetapi saya telah meninggalkannya dalam dataset. Urutan selalu dibiarkan terlebih dahulu kemudian ke kanan, bergerak ke bawah di sepanjang tubuh
V1-V15 adalah poin di kepala
V16-V21 adalah bahu
V22-V27 adalah siku
V28-V33 adalah tangannya
V34-V39 adalah pinggulnya
V40-V45 adalah lututnya
V46-V51 adalah kaki
Komponen vertikal adalah jumlah piksel dari bagian atas gambar, jadi Anda perlu mengambil (720 - variabel) dari ini untuk mendapatkan posisi yang benar pada gambar.
Ada juga beberapa variabel lain yang tersisa dari identifikasi pitcher, dan juga variabel yang berisi upaya dasar untuk mengukur pemisahan pinggul/bahu dari data 2D ini, ini bukan pengukuran yang dapat diandalkan!
Berkat BaseballSavant dan MLB untuk membuat highlight video yang mudah tersedia secara online, yang penting untuk mengumpulkan data pada skala ini.
Juga terima kasih kepada Will McNally untuk Kapao, semua deteksi pose dilakukan dengan menggunakan algoritma ini, diimplementasikan dalam Python.
https://github.com/wmcnally/kapao
Ini adalah jenis dataset yang belum pernah tersedia untuk umum sebelumnya, saya harap beberapa penggunaan dapat ditemukan untuk itu.
Jika Anda memiliki saran, hubungi Twitter @pitching_bot, atau temukan informasi kontak saya di situs web saya
Cameron Grove - 24/12/21