hltb scraper
1.0.0
게임 및 완료 시간 데이터를 추출하기 위해 Howlongtobeat를 기어 다니는 웹 거미.
그러한 풍부한 데이터로 훌륭한 서비스를 제공 한 Howlongtobeat에게 큰 감사를드립니다. 스크래핑에 대해 죄송합니다!
Hlongtobeat (HLTB)는 사람들이 게임을 완료하는 데 걸리는 시간을 발견하기위한 훌륭한 웹 사이트입니다. 데이터가 익숙하지만 불행히도 API가 부족합니다. 이 프로젝트는 웹 사이트에서 알려진 모든 게임 (글을 쓰는 시점)을 긁어 내고 게임 데이터와 기존 완료 항목을 추출합니다.
이 프로젝트는 데이터 과학의 세계로의 벤처의 일부입니다.
hltb-game.py
의 HLTB_Game_Spider
는 웹 사이트의 검색 기능을 통해 사용할 수있는 모든 게임을 긁어냅니다. hltb-completions.py
의 HLTB_Completions_Spider
.
HLTB_Game_Spider
는 열을 추출합니다 (사후 청소) :
id
웹 사이트의 게임 ID.title
- 게임 이름.main_story
몇 시간 동안 '메인 스토리'의 평균 완료 시간.main_plus_extras
시간에 'main + extras'의 평균 완료 시간.completionist
- 몇 시간 안에 '완료 주의자'의 평균 완료 시간.all_styles
'모든 스타일'의 평균 완료 시간.coop
시간에 '협동 조합'의 평균 완료 시간.versus
- 평균 완료 시간 '대' 몇 시간 만에.type
- 일반 게임 항목에서 DLC/Expansion
, Mod
및 ROM Hack
구별하기위한 입력 유형.developers
- 쉼표 공간에서 항목의 모든 개발자의 분리 목록.publishers
- 쉼표 공간에서 항목의 모든 게시자의 분리 된 목록.platforms
- 쉼표 공간 분리 된 모든 플랫폼 목록에서 항목을 사용할 수 있습니다.genres
- 항목을위한 쉼표로 구분 된 장르 목록.release_na
북미 출시일 (사용 가능한 경우).release_eu
유럽 출시일 (사용 가능한 경우).release_jp
일본 출시일 (사용 가능한 경우). HLTB_Completions_Spider
는 열을 추출합니다 (사후 청소) :
id
위의 데이터 세트와 교차 참조 할 수있는 게임 ID.type
- 완료 유형 ( Main Story
, Main + Extras
, Completionists
, Co-Op Multiplayer
, Speed Run - Any%
, Speed Run - 100%
).platform
- 플랫폼 특정 항목이 완료되었습니다.time
- 시간과 분의 입장 시간 (예 : 2hr 50m
).