Procyclingstats es un paquete de Python para extraer procyclingstats.com, que es un sitio web con estadísticas de ciclismo. Se recomienda familiarizarse con el sitio web antes de utilizar este paquete.
Usando pipa:
$ pip instalar procyclingstats
Manual (para desarrollo):
$ git clon https://github.com/themm1/procyclingstats.git
$ pip install -r procyclingstats/requirements_dev.txt
Uso de la clase básica Rider:
>>> de procyclingstats importar Rider
>>> jinete = Jinete("jinete/tadej-pogacar")
>>> jinete.fecha de nacimiento()
"1998-9-21"
>>> jinete.parse()
{
'fecha de nacimiento': '1998-9-21',
'altura': 1,76,
'nombre': 'Tadej Pogačar',
'nacionalidad': 'SI',
...
}
La interfaz consta de clases de raspado que actualmente son Race
, RaceStartlist
, RaceClimbs
, Ranking
, Rider
, RiderResults
, Stage
y Team
. El uso de todas las clases de scraping es casi el mismo y la única diferencia entre ellas son los métodos de análisis, como por ejemplo birthdate
en el ejemplo de uso de la clase Rider.
Dado que el proyecto es un raspador web que analiza HTML, es difícil hacerlo confiable y es común encontrar algunos problemas de análisis de HTML. Después de obtener algún tipo de comportamiento inesperado o errores de análisis, se recomienda actualizar el paquete en su sistema usando pip install procyclingstats --upgrade
. Si el problema continúa, consulte la página de problemas de GitHub y si el problema aún no se ha abierto, ¡no dude en abrir uno!