Procyclingstats é um pacote Python para raspar procyclingstats.com, que é um site com estatísticas de ciclismo. É recomendável familiarizar-se com o site antes de usar este pacote.
Usando pip:
$ pip instalar procyclingstats
Manual (para desenvolvimento):
$ git clone https://github.com/themm1/procyclingstats.git
$ pip install -r procyclingstats/requirements_dev.txt
Uso básico da classe Rider:
>>> de procyclingstats importar Rider
>>> piloto = Rider("piloto/tadej-pogacar")
>>> piloto.datadenascimento()
"21/09/1998"
>>> piloto.parse()
{
'data de nascimento': '21/09/1998',
'altura': 1,76,
'nome': 'Tadej Pogačar',
'nacionalidade': 'SI',
...
}
A interface consiste em classes de raspagem que atualmente são Race
, RaceStartlist
, RaceClimbs
, Ranking
, Rider
, RiderResults
, Stage
e Team
. O uso de todas as classes de raspagem é quase o mesmo e a única diferença entre elas são os métodos de análise, como é o caso birthdate
no exemplo de uso da classe Rider.
Como o projeto é um web scraper que analisa HTML, é difícil torná-lo confiável e é comum encontrar alguns problemas de análise de HTML. Após obter algum tipo de comportamento inesperado ou erros de análise, é recomendado atualizar o pacote em seu sistema usando pip install procyclingstats --upgrade
. Se o problema persistir, consulte a página de problemas do GitHub e se o problema ainda não tiver sido aberto, não hesite em abrir um!