يعد تنزيل السيول من المواقع المقرصنة أمرًا صعبًا بعض الشيء. تساعدك واجهة سطر الأوامر المستندة إلى Python على تنزيل ملفات التورنت بسهولة.
pip install bs4
pip install selenium
أي من المتصفحات التالية:
ملاحظة: لم يتم تنفيذ دعم متصفحي Firefox وIE بعد
usage: pyratebay.py [-h] [-c [{all,audio,video,apps,games,other}]] query
positional arguments:
query Name of the media to download
optional arguments:
-h, --help show this help message and exit
-c, --category [{all,audio,video,apps,games,other}]
Searches for the given 'name' in the specified
category (default = all)
تعمل مواقع خليج القراصنة المحدثة حديثًا بشكل مختلف. يقوم بجلب البيانات فقط بعد تحميل صفحة الويب. تتم تعبئة الجدول ديناميكيًا بواسطة JavaScript، مما يجعل من المستحيل استخراج بيانات صفحة الويب باستخدام requests
العادية أو وحدة urllib
حيث إنها تُرجع فقط محتوى HTML الأساسي لصفحة الويب دون أي جدول أو أشياء أخرى. للتغلب على هذه المشكلة، ينبغي للمرء السماح بتحميل صفحة الويب أولاً ثم مسح محتويات صفحة الويب باستخدام وحدات selenium
أو bs4
. تُعرف طريقة استخراج الويب هذه باسم تجريف الويب الديناميكي، والذي يتم تنفيذه بالفعل في هذا البرنامج.
رخصة معهد ماساتشوستس للتكنولوجيا