إذا كنت تستخدم pandas
، فما عليك سوى الحصول على البيانات عبر:
import pandas as pd
df_men = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv" )
df_women = pd . read_csv ( "https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv" )
إذا كنت تستخدم R
بدلاً من python
، فيمكنك تشغيل:
library( readr )
df_men <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDF_Riders_History.csv " )
df_women <- read_csv( " https://raw.githubusercontent.com/thomascamminady/LeTourDataSet/master/data/TDFF_Riders_History.csv " )
اعتبارًا من عام 2023، تتوفر بيانات Le Tour de France Femmes avec Zwift على الموقع الرسمي للجولة. يتم الآن تضمين هذه البيانات أيضًا. لضمان التوافق مع الإصدارات السابقة، يتم تخزين البيانات الخاصة بإصدارات الرجال والنساء من Le Tour في ملفات مختلفة.
كل راكب دراجة في سباق فرنسا للدراجات في ملف CSV واحد، مخزن في الملف data/TDF_Riders_History.csv
. توجد أيضًا بيانات في كل مرحلة في data/TDF_Stages_History.csv
.
يتم تخزين بيانات جولة السيدات في ملفات بالبادئة TDFF
(Tour de France Femmes).
في الصدفة الخاصة بك، فقط قم بتشغيل هذه الأوامر:
poetry install # to install the environment
poetry run python letourdataset / Downloader . py # get the data
بالنسبة للمشكلات المتعلقة بمجموعة البيانات هذه، راجع علامة التبويب المشكلات. هناك بعض الإدخالات غير صحيحة. ومع ذلك، يبدو حتى الآن أن الخطأ نابع من بيانات خاطئة على موقع Letour.fr. إذا نظرنا إلى الوراء، ربما كان ينبغي عليّ أن أقوم بإلغاء موقع ويب آخر.
تمت إعادة كتابة هذا الرمز بالكامل. الكود السابق، بما في ذلك المخرجات، موجود في المستودع القديم. ويجب قراءة legacy/README.txt
على وجه الخصوص.