مكشطة SEO python لاستخراج البيانات من صفحات نتائج محركات البحث الرئيسية. قم باستخراج البيانات مثل عنوان url والعنوان والمقتطف والمقتطف المنسق والنوع من نتائج البحث للكلمات الرئيسية المحددة. اكتشف الإعلانات أو قم بعمل لقطات شاشة تلقائية. يمكنك أيضًا جلب المحتوى النصي لعناوين URL المتوفرة في نتائج البحث أو بنفسك. إنه مفيد لتحسين محركات البحث والمهام البحثية المتعلقة بالأعمال.
احصل أيضًا على لقطة شاشة لكل صفحة نتائج. يمكنك أيضًا استخراج المحتوى النصي لكل عنوان URL للنتيجة. من الممكن أيضًا حفظ النتائج كملف CSV للتحليلات المستقبلية. إذا لزم الأمر، يمكنك أيضًا استخدام قائمة الوكيل الخاصة بك.
راجع http://serpscrap.readthedocs.io/en/latest/ للحصول على الوثائق.
المصدر متاح على https://github.com/ecoron/SerpScrap
الطريقة السهلة للقيام بذلك:
pip uninstall SerpScrap - y
pip install SerpScrap - - upgrade
مزيد من التفاصيل في قسم التثبيت [1] من الوثائق.
SerpScrap في تطبيقاتك
#!/usr/bin/python3
# -*- coding: utf-8 -*-
import pprint
import serpscrap
keywords = [ 'example' ]
config = serpscrap . Config ()
config . set ( 'scrape_urls' , False )
scrap = serpscrap . SerpScrap ()
scrap . init ( config = config . get (), keywords = keywords )
results = scrap . run ()
for result in results :
pprint . pprint ( result )
مزيد من التفاصيل في قسم الأمثلة [2] من الوثائق.
لتجنب مشكلات التشفير/فك التشفير، استخدم هذا الأمر قبل البدء في استخدام SerpScrap في cli.
chcp 65001
set PYTHONIOENCODING=utf-8
ملاحظات حول التغييرات الرئيسية بين الإصدارات
أوصي بالتحديث إلى أحدث إصدار من SerpScrap، لأن محرك البحث قام بتحديث ترميز صفحات نتائج البحث (serp)
يستخدم SerpScrap Chrome بدون رأس [3] وlxml [4] لاستخراج نتائج serp. بالنسبة لمحتويات النص الخام لعناوين URL التي تم جلبها، يتم استخدام beautifulsoup4 [5] . يدعم SerpScrap أيضًا PhantomJs [6]، الذي تم إهماله، وهو WebKit بدون رأس قابل للبرمجة، والذي يتم تثبيته تلقائيًا عند التشغيل الأول (Linux، Windows). كان سكرابكور مبنيًا على GoogleScraper [7]، وهو مشروع قديم، ويحتوي على العديد من التغييرات والتحسينات.
[1] | http://serpscrap.readthedocs.io/en/latest/install.html |
[2] | http://serpscrap.readthedocs.io/en/latest/examples.html |
[3] | http://chromedriver.chromium.org/ |
[4] | https://lxml.de/ |
[5] | https://www.crummy.com/software/BeautifulSoup/ |
[6] | https://github.com/ariya/phantomjs |
[7] | https://github.com/NikolaiT/GoogleScraper |