scrapetron عبارة عن حزمة Python لتجريد الويب توفر واجهة برمجة تطبيقات بسيطة وبديهية لاستخراج البيانات من مواقع الويب. باستخدام scrapetron ، يمكنك بسهولة استخراج صفحات الويب واستخراج المعلومات مثل النصوص والصور والروابط والمزيد.
يمكنك تثبيت scrapetron باستخدام النقطة:
pip install scrapetron
فيما يلي مثال بسيط لكيفية استخدام scrapetron لكشط صفحة ويب:
from scrapetron import scrapetron
url = 'https://www.example.com'
scraper = scrapetron ( url )
data = scraper . get_text ()
print ( data )
هنا في هذا المثال، نقوم بإنشاء كائن scrapetron جديد باستخدام عنوان URL لصفحة الويب التي نريد استخراجها. نقوم بعد ذلك باستدعاء طريقة get_text لاستخراج المحتوى النصي للصفحة.
يوفر scrapetron عددًا من الميزات لتجريد الويب، بما في ذلك:
لمزيد من المعلومات حول كيفية استخدام scrapetron ، يرجى الاطلاع على الوثائق.
إذا كنت ترغب في المساهمة في scrapetron ، يرجى تفرع المستودع وإرسال طلب سحب. نحن نرحب بالمساهمات من جميع الأنواع، بما في ذلك إصلاحات الأخطاء والميزات الجديدة وتحسينات الوثائق.
scrapetron مرخص بموجب ترخيص معهد ماساتشوستس للتكنولوجيا. راجع ملف الترخيص لمزيد من المعلومات.