pandas
使用する場合は、次の方法でデータを取得するだけです。
import pandas as pd
df_men = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv" )
df_women = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv" )
python
の代わりにR
使用する場合は、次を実行できます。
library( readr )
df_men <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv " )
df_women <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv " )
2023年現在、Le Tour de France Femmes avec Zwiftのデータは公式ツアーWebサイトで公開されています。このデータも含まれるようになりました。下位互換性を確保するために、Le Tour の男性用バージョンと女性用バージョンのデータは別のファイルに保存されています。
ツール・ド・フランスのすべてのサイクリストが 1 つの CSV ファイルにまとめられ、ファイルdata/TDF_Riders_History.csv
に保存されます。 data/TDF_Stages_History.csv
には各ステージのデータもあります。
女子ツアーのデータは、 TDFF
(Tour de France Femmes) という接頭辞が付いたファイルに保存されます。
シェルで次のコマンドを実行するだけです。
poetry install # to install the environment
poetry run python letourdataset / Downloader . py # get the data
このデータセットの問題については、「問題」タブを参照してください。一部誤った記載があります。しかし、今のところ、この間違いは、letour.fr ウェブサイト上の間違ったデータに起因しているようです。振り返ってみると、おそらく別のウェブサイトをスクレイピングするべきでした。
このコードは完全に書き直されました。出力を含む以前のコードはレガシー リポジトリにあります。特にlegacy/README.txt
必ず読んでください。