Searchor est une bibliothèque Python PyPi tout-en-un qui simplifie le web scraping, l'obtention d'informations sur un sujet et la génération d'URL de requête de recherche. Searchor est un outil efficace pour les développeurs Python, avec de nombreux besoins de développement Web en un, avec la prise en charge de plus de 100 moteurs et moteurs personnalisés autorisés, ce qui permet aux développeurs de l'utiliser facilement pour leurs besoins de programmation Web en Python sans compter sur de nombreux tiers. dépendances des partis. De plus, Searchor dispose d'une large gamme de supports, notamment une interface de ligne de commande et pip.
Python 3.7+ est requis
# MacOS / Linux (via Terminal)
python3 -m pip install -U searchor
# Windows (via CMD Prompt)
py -3 -m pip install -U searchor
>> > from searchor import Engine
>> > Engine . Google . search ( "Hello, World!" ))
' https : // www . google . com / search ? q = Hello % 2 C % 20 World % 21 '
>> > from searchor import Engine
>> > Engine . new ( "Colgate" , "https://www.colgate.com/en-us/search/all?term=" )
>> > Engine . Colgate . search ( "Hi world!" )
' https : // www . colgate . com / en - us / search / all ? term = Hi % 20 world !"
Démarrage rapide de la CLI Searchor
$ searchor Google " Hello World! " --copy
>> > from searchor import Information
>> > Information . scrape ( "https://google.com" )
>> > '{' title ': ' Google ', ' paragraphs ': [<p style="font-size:8pt;color:#70757a">© 2023 - <a href="/intl/en/policies/privacy/">Privacy</a> - <a href="/intl/en/policies/terms/">Terms</a></p>]}'
>> > from searchor import Information
>> > Information . getinfo ( "GitHub" )
>> > 'GitHub, Inc. is an Internet hosting service for software development and version control using Git. It provides the distributed version control of Git plus access control, bug tracking, software feature requests, task management, continuous integration, and wikis for every project. Headquartered in California, it has been a subsidiary of Microsoft since 2018.'
Jetez un œil à d’autres exemples dans le dossier d’exemples !
Remarque : les noms de moteurs suivent la convention UpperCamelCase (par exemple : ChromeWebStore).
Construire l'image du docker
$ docker build -t searchor .
Exécuter Searchor sur le conteneur Docker
$ docker run --rm -it searchor sh
/usr/src/searchor/examples # python searchamazon.py
https://www.amazon.com/s ? k=Hello%2C%20World%21
v2.5.0
Information
.getinfo
dans l'énumération Information
pour recueillir des informations sur un sujet donné, à l'aide de Wikipédia.web_scraper
dans l'énumération Information
, pour récupérer sur le Web une URL donnée.v2.5.2
Au lieu de fonctions différentes pour chaque moteur, Searchor v2.2.0
utilise une seule fonction avec une énumération Engine
. Cela facilite son utilisation et son entretien. Si vous migrez depuis v2.0.0
, comparez les différences entre les extraits suivants :
# Searchor 2.0.0
from searchor import search , Engine
search ( "Hello, World!" , Engine . Google )
# Searchor v2.2.0
from searchor import Engine
Engine . Google . search ( "Hello, World!" )
Jetez un œil aux directives de contribution !