Se você usa pandas
, basta obter os dados via:
import pandas as pd
df_men = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv" )
df_women = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv" )
Se você usar R
em vez de python
, poderá executar:
library( readr )
df_men <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv " )
df_women <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv " )
A partir de 2023, os dados do Le Tour de France Femmes avec Zwift estão disponíveis no site oficial da turnê. Esses dados agora também estão incluídos. Para garantir a compatibilidade com versões anteriores, os dados das versões masculina e feminina do Le Tour são armazenados em arquivos diferentes.
Cada ciclista do Tour de France em um único arquivo CSV, armazenado no arquivo data/TDF_Riders_History.csv
. Também há dados sobre cada estágio em data/TDF_Stages_History.csv
.
Os dados do tour feminino são armazenados em arquivos com o prefixo TDFF
(Tour de France Femmes).
No seu shell, basta executar estes comandos:
poetry install # to install the environment
poetry run python letourdataset / Downloader . py # get the data
Para problemas com este conjunto de dados, consulte a guia Problemas. Existem algumas entradas que estão incorretas. No entanto, até agora parece que o erro decorre de dados errados no site letour.fr. Olhando para trás, eu provavelmente deveria ter copiado outro site.
Este código foi completamente reescrito. O código anterior, incluindo a saída, está no repositório legado. Especialmente legacy/README.txt
deve ser lido.