Wenn Sie pandas
verwenden, holen Sie sich die Daten einfach über:
import pandas as pd
df_men = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv" )
df_women = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv" )
Wenn Sie R
anstelle von python
verwenden, können Sie Folgendes ausführen:
library( readr )
df_men <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv " )
df_women <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv " )
Ab 2023 sind die Daten für Le Tour de France Femmes avec Zwift auf der offiziellen Tour-Website verfügbar. Diese Daten sind nun ebenfalls enthalten. Um die Abwärtskompatibilität sicherzustellen, werden die Daten für die Herren- und Damenversion von Le Tour in unterschiedlichen Dateien gespeichert.
Jeder Radfahrer der Tour de France in einer einzigen CSV-Datei, gespeichert in der Datei data/TDF_Riders_History.csv
. Es gibt auch Daten zu jeder Phase in data/TDF_Stages_History.csv
.
Die Tourdaten der Damen werden in Dateien mit dem Präfix TDFF
(Tour de France Femmes) gespeichert.
Führen Sie in Ihrer Shell einfach die folgenden Befehle aus:
poetry install # to install the environment
poetry run python letourdataset / Downloader . py # get the data
Informationen zu Problemen mit diesem Datensatz finden Sie auf der Registerkarte „Probleme“. Es gibt einige Eingaben, die falsch sind. Bisher scheint es jedoch, dass der Fehler auf falschen Daten auf der Website letour.fr beruht. Rückblickend hätte ich wahrscheinlich eine andere Website löschen sollen.
Dieser Code wurde komplett neu geschrieben. Der vorherige Code, einschließlich der Ausgabe, befindet sich im Legacy-Repository. Besonders legacy/README.txt
sollte gelesen werden.