การดาวน์โหลดทอร์เรนต์จากเว็บไซต์ละเมิดลิขสิทธิ์นั้นค่อนข้างยุ่งยาก CLI ที่ใช้ Python นี้ช่วยให้คุณดาวน์โหลดทอร์เรนต์ได้อย่างง่ายดาย
pip install bs4
pip install selenium
เบราว์เซอร์ใด ๆ ต่อไปนี้:
หมายเหตุ: ยังไม่มีการรองรับเบราว์เซอร์ Firefox และ IE
usage: pyratebay.py [-h] [-c [{all,audio,video,apps,games,other}]] query
positional arguments:
query Name of the media to download
optional arguments:
-h, --help show this help message and exit
-c, --category [{all,audio,video,apps,games,other}]
Searches for the given 'name' in the specified
category (default = all)
ไซต์อ่าวโจรสลัดที่อัปเดตใหม่ทำงานแตกต่างออกไป จะดึงข้อมูลหลังจากโหลดหน้าเว็บเท่านั้น ตารางถูกเติมแบบไดนามิกโดย JavaScript ซึ่งทำให้ไม่สามารถขูดข้อมูลของหน้าเว็บโดยใช้ requests
ปกติหรือโมดูล urllib
เนื่องจากจะส่งคืนเฉพาะเนื้อหา HTML พื้นฐานของหน้าเว็บโดยไม่มีตารางและสิ่งอื่น ๆ เพื่อแก้ไขปัญหานี้ ควรปล่อยให้หน้าเว็บโหลดก่อน จากนั้นจึงขูดเนื้อหาของหน้าเว็บโดยใช้โมดูล selenium
หรือ bs4
วิธีการขูดเว็บนี้เรียกว่าการขูดเว็บแบบไดนามิก ซึ่งนำไปใช้จริงในโปรแกรมนี้
ใบอนุญาตของเอ็มไอที