pandas
사용하는 경우 다음을 통해 데이터를 가져옵니다.
import pandas as pd
df_men = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv" )
df_women = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv" )
python
대신 R
사용하는 경우 다음을 실행할 수 있습니다.
library( readr )
df_men <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv " )
df_women <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv " )
2023년 현재 Le Tour de France Femmes avec Zwift의 데이터는 공식 투어 웹사이트에서 확인할 수 있습니다. 이제 이 데이터도 포함되었습니다. 이전 버전과의 호환성을 보장하기 위해 Le Tour의 남성 버전과 여성 버전의 데이터는 서로 다른 파일에 저장됩니다.
단일 CSV 파일에 있는 투르 드 프랑스의 모든 사이클리스트는 data/TDF_Riders_History.csv
파일에 저장됩니다. data/TDF_Stages_History.csv
에는 모든 단계에 대한 데이터도 있습니다.
여자 투어 데이터는 접두어 TDFF
(Tour de France Femmes)가 붙은 파일에 저장됩니다.
셸에서 다음 명령을 실행하세요.
poetry install # to install the environment
poetry run python letourdataset / Downloader . py # get the data
이 데이터 세트와 관련된 문제는 문제 탭을 참조하세요. 일부 잘못된 항목이 있습니다. 그러나 현재까지는 letour.fr 웹사이트의 잘못된 데이터에서 이러한 실수가 발생한 것으로 보입니다. 돌이켜보면 아마도 다른 웹사이트를 스크랩했어야 했을 것입니다.
이 코드는 완전히 다시 작성되었습니다. 출력을 포함한 이전 코드는 레거시 저장소에 있습니다. 특히 legacy/README.txt
읽어야 합니다.