แมงมุมเว็บที่รวบรวมข้อมูล howlongtobeat เพื่อแยกเกมและข้อมูลเวลาเสร็จสมบูรณ์
ขอขอบคุณ HowlongTobeat ที่ยิ่งใหญ่สำหรับการให้บริการที่ยอดเยี่ยมเช่นนี้ ขออภัยเกี่ยวกับการขูด!
HowlongTobeat (HLTB) เป็นเว็บไซต์ที่ยอดเยี่ยมสำหรับการค้นพบเวลาที่ผู้คนใช้ในการเล่นเกมให้สำเร็จ ในขณะที่สุกด้วยข้อมูล แต่น่าเสียดายที่ขาด API โครงการนี้ทำให้เกมที่รู้จักทั้งหมด (ในเวลาที่เขียน) บนเว็บไซต์แยกข้อมูลเกมรวมถึงรายการที่เสร็จสมบูรณ์ทั้งหมด
โครงการนี้เป็นส่วนหนึ่งของการร่วมทุนของฉันสู่โลกแห่งวิทยาศาสตร์ข้อมูล
HLTB_Game_Spider
ใน hltb-game.py
scrapes เกมทั้งหมดที่มีอยู่ผ่านฟังก์ชั่นการค้นหาของเว็บไซต์ HLTB_Completions_Spider
ใน hltb-completions.py
scrapes รายการเสร็จสิ้นผู้ใช้ทั้งหมดที่ส่งมาสำหรับแต่ละเกมเดียวกัน (แม้ว่าบางรายการจะไม่มีรายการและจะหายไป)
คอลัมน์ HLTB_Game_Spider
แยกคอลัมน์ (โพสต์ทำความสะอาด):
id
- รหัสเกมจากเว็บไซต์title
- ชื่อเกมmain_story
- เวลาเสร็จเฉลี่ยของ 'เรื่องราวหลัก' ในเวลาไม่กี่ชั่วโมงmain_plus_extras
- เวลาเสร็จเฉลี่ยของ 'main + extras' ในชั่วโมงcompletionist
- เวลาเสร็จเฉลี่ยของ 'เสร็จสมบูรณ์' ในเวลาไม่กี่ชั่วโมงall_styles
- เวลาเสร็จเฉลี่ยของ 'สไตล์ทั้งหมด' ในชั่วโมงcoop
- เวลาเสร็จเฉลี่ยของ 'co -op' ในเวลาไม่กี่ชั่วโมงversus
- เวลาเสร็จเฉลี่ยของ 'vs. ' ในชั่วโมง.type
- พิมพ์รายการเพื่อแยกความแตกต่าง DLC/Expansion
, Mod
และ ROM Hack
จากรายการเกมปกติdevelopers
- รายการที่คั่นด้วยเครื่องหมายจุลภาคของนักพัฒนาทั้งหมดของรายการpublishers
- รายการคั่นด้วยเครื่องหมายจุลภาคของผู้เผยแพร่ทั้งหมดของรายการplatforms
- รายการคั่นด้วยเครื่องหมายจุลภาคของแพลตฟอร์มทั้งหมดมีรายการเข้าgenres
- รายการประเภทที่คั่นด้วยเครื่องหมายจุลภาคสำหรับรายการrelease_na
- วันที่วางจำหน่ายในอเมริกาเหนือ (ถ้ามี)release_eu
- วันที่วางจำหน่ายในยุโรป (ถ้ามี)release_jp
- วันที่วางจำหน่ายในญี่ปุ่น (ถ้ามี) คอลัมน์ HLTB_Completions_Spider
สกัดคอลัมน์ (โพสต์ทำความสะอาด):
id
- รหัสเกม ที่สามารถอ้างอิงข้ามกับชุดข้อมูลด้านบนtype
- ประเภทของรายการที่สมบูรณ์ ( Main Story
, Main + Extras
, Completionists
, Co-Op Multiplayer
, Speed Run - Any%
, Speed Run - 100%
)platform
- แพลตฟอร์มรายการเฉพาะเสร็จสมบูรณ์time
- เวลาในการเข้าชั่วโมงและนาที (เช่น 2hr 50m
)