Jika Anda menggunakan pandas
, dapatkan saja datanya melalui:
import pandas as pd
df_men = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv" )
df_women = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv" )
Jika Anda menggunakan R
alih-alih python
, Anda dapat menjalankan:
library( readr )
df_men <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv " )
df_women <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv " )
Pada tahun 2023, data Le Tour de France Femmes avec Zwift tersedia di situs web tur resmi. Data ini sekarang disertakan juga. Untuk memastikan kompatibilitas ke belakang, data Le Tour versi pria dan wanita disimpan dalam file berbeda.
Setiap pengendara sepeda Tour de France dalam satu file CSV, disimpan dalam file data/TDF_Riders_History.csv
. Ada juga data di setiap tahapan di data/TDF_Stages_History.csv
.
Data tur putri disimpan dalam file dengan awalan TDFF
(Tour de France Femmes).
Di shell Anda, jalankan saja perintah ini:
poetry install # to install the environment
poetry run python letourdataset / Downloader . py # get the data
Untuk masalah pada kumpulan data ini, lihat tab Masalah. Ada beberapa entri yang salah. Namun, sejauh ini tampaknya kesalahan tersebut bermula dari kesalahan data di situs letour.fr. Melihat ke belakang, saya mungkin seharusnya menghapus situs web lain.
Kode ini telah sepenuhnya ditulis ulang. Kode sebelumnya, termasuk outputnya, ada di repositori lama. Terutama legacy/README.txt
yang harus dibaca.