如果您使用pandas
,只需通过以下方式获取数据:
import pandas as pd
df_men = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv" )
df_women = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv" )
如果您使用R
而不是python
,您可以运行:
library( readr )
df_men <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv " )
df_women <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv " )
截至 2023 年,Le Tour de France Femmes avec Zwift 的数据可在官方巡回赛网站上获取。现在也包含此数据。为了确保向后兼容性,Le Tour 男士和女士版本的数据存储在不同的文件中。
环法自行车赛的每位自行车手都在一个 CSV 文件中,存储在文件data/TDF_Riders_History.csv
中。 data/TDF_Stages_History.csv
中还有每个阶段的数据。
女子巡回赛数据存储在前缀为TDFF
(Tour de France Femmes)的文件中。
在您的 shell 中,只需运行以下命令:
poetry install # to install the environment
poetry run python letourdataset / Downloader . py # get the data
有关此数据集的问题,请参阅“问题”选项卡。有一些条目不正确。然而,到目前为止,该错误似乎源于letour.fr网站上的错误数据。回想起来,我可能应该抓取另一个网站。
这段代码已被完全重写。以前的代码(包括输出)位于旧存储库中。尤其应该阅读legacy/README.txt
。