Si vous utilisez pandas
, récupérez simplement les données via :
import pandas as pd
df_men = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv" )
df_women = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv" )
Si vous utilisez R
au lieu de python
, vous pouvez exécuter :
library( readr )
df_men <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv " )
df_women <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv " )
Depuis 2023, les données du Tour de France Femmes avec Zwift sont disponibles sur le site officiel du tour. Ces données sont désormais également incluses. Pour assurer la compatibilité ascendante, les données des versions masculine et féminine du Tour sont stockées dans des fichiers différents.
Tous les cyclistes du Tour de France dans un seul fichier CSV, stocké dans le fichier data/TDF_Riders_History.csv
. Il existe également des données sur chaque étape dans data/TDF_Stages_History.csv
.
Les données du tour féminin sont stockées dans des fichiers portant le préfixe TDFF
(Tour de France Femmes).
Dans votre shell, exécutez simplement ces commandes :
poetry install # to install the environment
poetry run python letourdataset / Downloader . py # get the data
Pour les problèmes liés à cet ensemble de données, consultez l'onglet Problèmes. Certaines entrées sont incorrectes. Cependant, jusqu’à présent, il semble que l’erreur provienne de données erronées sur le site letour.fr. Avec le recul, j'aurais probablement dû gratter un autre site Web.
Ce code a été complètement réécrit. Le code précédent, y compris la sortie, se trouve dans le référentiel existant. Surtout legacy/README.txt
doit être lu.