该存储库包含“足球比赛中时空比赛事件的公共数据集”论文中描述的 Wyscout 数据,但已处理为常规 Wyscout 形式。以这种形式,它可以由 kloppy 等库加载。
该数据集包含以下竞赛:
竞赛 | 游戏数量 | 季节 |
---|---|---|
法甲1 | 380 | 2017/18 |
英格兰超级联赛 | 380 | 2017/18 |
意大利甲级联赛 | 380 | 2017/18 |
西班牙甲级联赛 | 380 | 2017/18 |
德甲联赛 | 306 | 2017/18 |
男子世界杯 | 64 | 2018年 |
男子欧洲杯 | 51 | 2016年 |
安德鲁·罗林森 (2020):足球射门质量
原始文件被处理为常规 JSON 形式。这使得使用 kloppy 加载数据成为可能。由于 kloppy >=1.5.2,可以使用 kloppy datasets
api 直接访问此数据集。
您可以在存储库的索引中找到所有可用的匹配项。
注意:确保您的 kloppy 版本 >=1.5.2。
您可以使用数据集 api 加载默认比赛(2499841 - 哈德斯菲尔德镇 - 曼城):
from kloppy import datasets
dataset = datasets . load ( "wyscout" )
如果您想使用任何其他匹配,则必须指定 match_id:
from kloppy import datasets
dataset = datasets . load ( "wyscout" , match_id = 2499843 )
wget https://raw.githubusercontent.com/koenvo/wyscout-soccer-match-event-dataset/main/processed/1694390.json
from kloppy import load_wyscout_event_data
dataset = load_wyscout_event_data ( "1694390.json" )
类型 | 格式 | 网址 |
---|---|---|
玩家 | JSON | https://ndownloader.figshare.com/files/15073721 |
团队 | JSON | https://ndownloader.figshare.com/files/15073697 |
火柴 | 压缩 JSON | https://ndownloader.figshare.com/files/14464622 |
活动 | 压缩 JSON | https://ndownloader.figshare.com/files/14464685 |
与 kloppy 版本 < 3.14 兼容
兼容 kloppy 版本 >= 3.14
帕帕拉多,卢卡; Massucco, Emanuele (2019):足球比赛事件数据集。无花果共享。收藏。 https://doi.org/10.6084/m9.figshare.c.4415000
帕帕拉多,L.,辛蒂亚,P.,罗西,A. 等人。足球比赛中时空比赛事件的公共数据集。科学数据 6, 236 (2019)。 https://doi.org/10.1038/s41597-019-0247-7
数据来源:https://figshare.com/collections/Soccer_match_event_dataset/4415000/2 上公开提供
数据集根据 CC BY 4.0 许可证发布。