Если вы используете pandas
, просто получите данные через:
import pandas as pd
df_men = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv" )
df_women = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv" )
Если вы используете R
вместо python
, вы можете запустить:
library( readr )
df_men <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv " )
df_women <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv " )
По состоянию на 2023 год данные Le Tour de France Femmes avec Zwift доступны на официальном сайте тура. Эти данные теперь также включены. Для обеспечения обратной совместимости данные мужской и женской версий Le Tour хранятся в разных файлах.
Каждый велосипедист Тур де Франс в одном файле CSV, хранящемся в файле data/TDF_Riders_History.csv
. Также есть данные о каждом этапе в data/TDF_Stages_History.csv
.
Данные женского тура хранятся в файлах с префиксом TDFF
(Tour de France Femmes).
В своей оболочке просто запустите эти команды:
poetry install # to install the environment
poetry run python letourdataset / Downloader . py # get the data
Проблемы с этим набором данных см. на вкладке «Проблемы». Есть некоторые записи, которые неверны. Однако пока похоже, что ошибка связана с неправильными данными на сайте letour.fr. Оглядываясь назад, я понимаю, что мне, вероятно, следовало очистить другой сайт.
Этот код был полностью переписан. Предыдущий код, включая выходные данные, находится в устаревшем репозитории. Особенно следует прочитать legacy/README.txt
.